TIL/프로젝트

Final Project - 쇼핑몰 리뷰 분석 기반 브랜드 인사이트 도출

monawa 2023. 1. 16.
728x90

1. 주제 : 쇼핑몰 리뷰 분석 기반 브랜드 인사이트 도출

 

2.주제 선정의 배경

한국 통계청이 집계한 바에 따르면 최근 21년 2분기 온라인쇼핑 시장규모는 46.9조원으로 전년비 25.2% 성장했습니다. 전분기 44.9조원, 21.8%보다 성장률이 더욱 더 커지고 있습니다.

쇼핑몰의 이용자 수가 늘어남에 따라 상품에 달리는 후기와 댓글의 수가 기하급수적으로 늘고 있습니다.

유명 의류 온라인 쇼핑몰의 상의 의류 제품들의 경우 제품 후기 개수가 약 1,000개에 육박하고 있으며, 1,000개 이상의 상품 문의 글을 보유하고 있습니다.

그러나 많은 제품의 모든 댓글과 리뷰를 읽을 수는 없기 때문에 제품에 대해 객관적인 판단이 힘들어졌습니다.

또한 자영업자들의 플랫폼 입점이 늘어나 경쟁이 과열 양상을 보이는 것도 셀러들이 플랫폼을 이탈하는 요인 중 하나다. 무신사에서 남성복을 판매하던 김모씨(40)는 지난달 권리금 조로 1000만원을 붙여 브랜드 운영권을 내놨다. “네이버 스토어와 무신사 등 플랫폼에 경쟁자들이 대거 유입돼 매출이 대폭 줄었다” 라는 이야기가 있을 만큼 온라인 쇼핑 플랫폼에서의 경쟁이 심화되고 있습니다.

 

3. 활용 데이터

무신사의 상품정보 및 리뷰데이터를 크롤링 

 

무신사 스토어

온라인 패션 스토어. 우리가 사랑한 패션의 모든 것, 다 무신사랑 해.

www.musinsa.com

 

데이터 출처 무신사 상품 정보 및 리뷰 데이터 크롤링
데이터 수집기준 각 브랜드 별 상품에서 별점 낮은순 900개씩(데이터수집 (낮은리뷰 갯수가 적어서 부정리뷰외에도 긍정리뷰 다수포함)
수집된 브랜드 라퍼지스토어, 꼼파뇨, 드로우핏, 인사일런스, 커버낫, 파르티멘토, 필루미네이트, 와릿이즌, 수아레, 내셔널지오그래픽, 예일, 디즈이스네버댓, 아웃스탠딩, 리, 어반드레스
수집한 내용 상품명 / 상품의 리뷰 / 평점 / 제품사이즈 / (리뷰를 작성한) 닉네임, 레벨/ 카테고리/상품 넘버

 

3-1 데이터 샘플 

 

4. 프로젝트 수행과정

브랜드별 상품,리뷰정보 크롤링 -> 평점을 기준으로 긍정,부정 라벨링 -> 정규 표현식을 통해 1차 정제

-> keybert, wordrank를 적용하여 키워드 추출 (두개를 쓴이유는 키버트가 추출 시간이 오래걸려서 결과물을 확인시 원화는 결과물과 둘다 비슷하게 나왔기에 wordrank를 추가적으로 사용)

 

 

5. 프로젝트 시각화

(스트림릿 웹페이지)

(시각화)

5-1 이를 통한 최종 인사이트 도출 

 

6. 프로젝트 진행시 문제점 및 개선해야할점 (피드백 받은것들 정리)

- 데이터 인풋과 아웃풋까지의 과정을 이해하지 못해서 중간이 빠져있다 이 부분을 더 공부 해보셔야 한다
( 데이터 분석가가 분석한 지표를 설명 못한다면 신뢰도를 주지 못하고 그럼 의미없는 분석결과가 된다 )

-> 기본으로 돌아가서 내가 쓴 모델의 작동 과정과 결과물 지표를 이해해야겠다 

 

6-1 개인적 회고

평소 하던 대로 서비스를 기획하고 기간 내 완성해야 한다는 것에 집중해서 어떻게든 돌아는 가는 결과물을 만들려고 이해하지 못한 채 코드를 작성해서 정작 남에게 내가 과정을 이해하지 못하는 결과물을 도출해냈고 그런 분석은 보지 않는 분석이라는 피드백이 크게 다가왔습니다 조언 받은 대로 필요 없는 분석을 모델을 써보기 위해 하는 건 의미 없고 내가 사용하는 모델의 작동원리와 출력물의 의미를 파악해서 과정을 더 깊게 생각해야겠습니

728x90

댓글