PIP (문제해결프로젝트)

데이터사이언스를 통한 당면 과제의 솔루션 구하기
문제해결 프로젝트는 팀단위로 문제를 스스로 해결하는 과정을 담고 있습니다.

대한민국 20대 총선 분석 - 3조

작성자
DaeSeo
작성일
2017-01-12 12:10
조회
91

1. 팀 소개


1.1 팀명


  • 3조


 

1.2 팀원


  • 김정식(사회학과), 임준오(사회학과), 왕서영(정보통계학과), 최한희(정보통계학과)


 

2. 프로젝트 소개


2.1 데이터 분석 주제


  • 대한민국 20대 총선 분석

  • 선거결과를 예측 및 예측할 수 있는 도구 구현

  • 18,19대 국회의원 선거를 통해 20대 국회의원 선거의 결과를 예측


2.2 데이터의 종류 및 특징


  • 18,19,20대 국회의원 데이터
    • 정당

    • 나이

    • 이전직업

    • 재선여부

    • 재출마여부

    • 병역유무

    • 당선여부

    • 신문 기사 수

    • 정치입문년도

    • 여야

    • 20대 만 : 트윗수, 긍정/부정 트윗수



2.3 데이터 분석 도구 및 기법


  • 분석 도구 : SPSS

  • 분석 전략
    • 신문기자는 특별한 경우가 아니면 당선가능성이 더 높은 후보의 가사를 쓰려고 할 것

    • 신문기사 뿐만아니라 인터넷에서 얻을수 있는 후보자 정보를 가지고 당선가능성을 예측

    • 당선결과와 연관성이 있는 변수들을 통해 당선에 성공하는 후보자들의 주요 특징을 파악할수 있을 것


  • 분석 기법
    • 이산형 변수 : 카이제곱분석

    • 연속형 변수 : 독립표본T검정

    • 의사결정트리를 이용해 당선결과 예측을 위한 변수 파악



 

2.4 프로젝트 일정


  • 2014.10.06. ~ 2014.10.12. : 주제 회의

  • 2014.10.20. ~ 2014.10.19. : 데이터 자료 수집 회의

  • 2014.10.20. ~ 2014.11.02. : 데이터 자료 수집

  • 2014.11.03. ~ 2014.11.09. : 데이터 전처리

  • 2014.11.10. ~ 2014.11.16. : 데이터 분석

  • 2014.11.17. ~ 2014.11.23. : 데이터 분석, 보고서 정리


 

2.5 프로젝트 수행 성과


  • 신문기사와 당선의 관계에 대해서 유의미한 결과를 도출

  • 정당에서 예측한 유력후보 예측 정답률은 51%, 신문기사 수를 이용한 예측은 59.1%