이번에는 deep daiv 여름기수 팀프로젝트로 했던 '네이버 영화 가짜 리뷰 판별'을 주제로 글을 써보고자 한다. 이 프로젝트를 시작하기 전에 가짜리뷰 기준을 총 3가지 case로 정했다. 1. 의도적으로 깎아내리려고 하거나 또는 홍보 목적의 리뷰 2. 동일한 영화내 같은 사람이 동일한 내용으로 여러번 작성한 리뷰 및 상반된 리뷰 3.영화와 관련 없는 리뷰 위와 같은 기준으로 가짜리뷰를 판별한 뒤 최종 리뷰 보정하는 것이 본 프로젝트의 목표이다. (데이터는 네이버 영화에 들어가 직접 크롤링을 진행) 1. 의도적으로 긍정적 또는 부정적인 리뷰 이 리뷰들을 판별하기 위해서 감정분석을 진행 감정분석을 진행하기 전에 우선 점수 리뷰에 대해서 8~10점을 긍정, 1~3점을 부정으로 분류함 (긍정의 값은 1로 설..
2022년 deep daiv 봄기수에 했던 팀프로젝트를 간단하게 회고하고자 한다. 많관부✌️✌️ 우리 팀은 "머신러닝을 활용한 특수학교 최적입지 선정"을 주제로 잡았다. 이 프로젝트를 시작할 때 장애인에 대한 이슈가 많아서 자연스럽게 장애인 관련해서 주제를 잡았던 거 같다. 지역은 서울을 대상으로 하기로 했고 먼저 구를 선정한 다음에 동을 선정하기로 했다. 우리 프로젝트의 프로세스를 말하자면.. 1. 평가지표 설정(의료지수, 문화지수 등등) 2.구에 따른 평가지표 scaling(이때 scaler는 MinMaxScale적용) 3.평가지표에 사용된 각 요소에 따른 가중치 설정한 다음 최종 지수 설정 4.군집화 및 최적의 구 도출 5. 결론 1. 평가지표 설정 평가 지표로는 총 7가지를 임의로 설정했다. 각 ..