PIP (문제해결프로젝트)

데이터사이언스를 통한 당면 과제의 솔루션 구하기
문제해결 프로젝트는 팀단위로 문제를 스스로 해결하는 과정을 담고 있습니다.

중고폰 거래 전략 분석 - 우리폰팔조

작성자
DaeSeo
작성일
2017-01-12 12:22
조회
102

1. 팀 소개


1.1 팀명


  • 우리폰팔조


 

1.2 팀원


  • 최현종(국어국문), 박찬민(컴퓨터과학), 이민경(의생명공학), 신민(경영)


 

2. 프로젝트 소개


2.1 데이터 분석 주제


  • 중고폰 데이터를 통한 가격 예측과 판매 확률 예측

  • 온라인 중고폰 거래 데이터 분석을 통해 판매자와 구매자 모두에게 중고폰 거래 전략을 제시하여 합리적 거래를 지원


2.2 데이터의 종류 및 특징


  • 휴대폰 판매 게시글 : 중고나라
    • 판매 가격

    • 판매 여부

    • 기기 종류

    • 기기 색상

    • 기기 용량

    • 통신사

    • 변경 유형

    • 사용 기간

    • 액정 파손 여부

    • 손상 여부

    • 직거래 여부

    • 택배거래 여부

    • 안전거래 여부

    • 거래 지역 1

    • 거래 지역 2

    • 충전기 여부

    • 이어폰 여부

    • 사은품 여부

    • 흥정 여부

    • 게시 사진수

    • 게시 날짜

    • 게시 시간

    • 조회수

    • 댓글수

    • 제목

    • 본문

    • ID

    • URL



2.3 데이터 분석 도구 및 기법


  • 분석 도구 : Exel, R, Python, Tableau

  • 분석 전략
    • 거래 데이터를 통해 종속 변수를 가격과 판매 여부로 둔 예측 모델 작성

    • 분석 결과를 판매자와 구매자 모두에게 효과적으로 전달하는 과정 고려


  • 분석 기법
    • 가격 예측 : 다중회귀분석

    • 판매 예측 : 로지스틱회귀, 의사결정트리

    • 판매 게시글 : 텍스트 마이닝, 워드클라우드



 

2.4 프로젝트 일정


  • 2016.03.03~2016.03.31 : 주제선정 및 문제이해

  • 2016.04.01.~2016.04.25 : 데이터 수집 및 탐색

  • 2016.04.26~2016.05.03 : 데이터 정제 및 중간 보고서 작성

  • 2016.05.03~2016.05.31 : 추가 데이터 수집 및 알고리즘 탐색

  • 2016.06.01~2016.06.19 : 데이터 분석 및 최종보고서 작성


 

2.5 프로젝트 수행 성과


  • 가격 예측의 경우, 다중회귀분석의 결과로 RMSE는 평균 5.65, MAPE의 경우 평균 8.74가나왔다. 판매 예측의 경우, 로지스틱회귀 결과로 정확도(Accuracy)가 약 0.64로 나왔으며, 판매된 게시 글/판매 되지 않은 게시글의 명사 단어만 추출하는 형태소 분석을 하여 빈도로 순위를 보고 워드 클라우드를 통해 특성을 확인

  • 프로젝트 분석 결과를 R-Shiny를 통해 고객에게 서비스할 수 있는 페이지를 구축