2022년 deep daiv 봄기수에 했던 팀프로젝트를 간단하게 회고하고자 한다.
많관부✌️✌️
우리 팀은 "머신러닝을 활용한 특수학교 최적입지 선정"을 주제로 잡았다.
이 프로젝트를 시작할 때 장애인에 대한 이슈가 많아서
자연스럽게 장애인 관련해서 주제를 잡았던 거 같다.
지역은 서울을 대상으로 하기로 했고
먼저 구를 선정한 다음에 동을 선정하기로 했다.
우리 프로젝트의 프로세스를 말하자면..
1. 평가지표 설정(의료지수, 문화지수 등등)
2.구에 따른 평가지표 scaling(이때 scaler는 MinMaxScale적용)
3.평가지표에 사용된 각 요소에 따른 가중치 설정한 다음 최종 지수 설정
4.군집화 및 최적의 구 도출
5. 결론
1. 평가지표 설정
평가 지표로는 총 7가지를 임의로 설정했다.
각 지수를 만든 과정은 아래와 같다.
의료지수: 우선 각 구마다 병원 개수(정신병원, 종합병원) 현황 데이터 이용
교통지수: 버스정류장 및 지하철역 개수, 그리고 주차공간 현황 데이터 이용
문화/체육지수: 도서관, 공공체육관, 문화복지시설,공원 현황 데이터 이용
유해성지수:유흥주점 개수 이용
공시지가: 공시지가 데이터 이용
장애인수:장애인 수 데이터 이용
복지지수: 사회복지시설 및 치안시설(경찰서, 파출소) 현황 데이터 이용
2.Scaling
위와 같이 각 지표를 설정하고 나니 숫자가 너무 큰 것을 확인
따라서 MinMaxScaler를 이용하여 각 지수에 1~10까지 Scaling을 진행
3.가중치 설정
스케일링을 한 다음에 각 지수에 사용된 데이터마다 다른 가중치를 설정
이때 가중치는 임의로 설정함
문화/체육지수로 예를 들자면,
도서관에는 가중치 0.1로 설정했고, 공공체육시설에는 가중치 0.1
문화복지시설에는 가중치 0.5를, 공원 데이터에는 가중치 0.3을 사용하여
각 데이터에 가중치를 곱한 값을 다 더해서 최종 문화/복지 지수를 생성
다른 지수들도 위와 같이 가중치를 설정
단, 유흥지수만 다르게 진행 > 점수가 높을수록 최적의 구로 설정한 것을 고려하여
유흥지수는 스케일링을 한뒤 역수를 취한 다음 가중치를 설정
4.군집화 및 최종 점수 도출
1~3번 과정을 통해 최종 데이터를 생성
평가 지수를 종합한 최종 점수를 도출하기 위해 군집화를 진행
총 4개의 그룹으로 군집화를 진행하였고
군집화를 한 다음에 각 지수마다 가중치를 설정하여 최종점수를 도출
최종점수는 아래와 같다.
아래는 태블로로 시각화 한 결과이다.
군집0이 가장 좋은 점수가 나왔고
실제로, 9개의 자치구 중 동대문구를 제외한 나머지 자치구에는 특수학교가 존재
더불어 최종점수에서 2등을 차지한 군집3에서도
영등포구를 제외한 나머지 자치구에는 특수학교가 존재한다는 것을 확인
따라서 우리는 영등포구와 동대문구를 최적의 구로 설정
5.결론
특수학교 설립 조건 중 하나인 경사도 4.8를 넘어서는 안된다는 점을 반영하기 위해
영등포구와 동대문구에 대해서 GIS분석 진행
+
각 동마다의 장애인수를 고려하여 최적의 동을 도출함
분석을 통해 선정한 동대문구 내의 최적 입지는 ‘장안동’이었고
영등포구 내의 최적입지는 대림동으로 나왔다.
7. 프로젝트를 진행하면서 느꼈던 아쉬운 점
a)근거 부족
> 여러가지 사항으로 고려해서
가중치를 부여했지만
결론적으로는 정확한 지표를 근거로 하지않고
가중치를 설정
b) 데이터의 한계
> 특수교육 대상장에 해당하는 저연령층 장애인이 아닌
전연령층 장애인 데이터를 가지고 프로젝트를 진행
'🖥️ ProJects > Deep Daiv' 카테고리의 다른 글
네이버 영화 가짜 리뷰 판별 및 리뷰 보정 (0) | 2023.01.26 |
---|