728x90 TIL/프로젝트3 Final Project - 쇼핑몰 리뷰 분석 기반 브랜드 인사이트 도출 1. 주제 : 쇼핑몰 리뷰 분석 기반 브랜드 인사이트 도출 2.주제 선정의 배경 한국 통계청이 집계한 바에 따르면 최근 21년 2분기 온라인쇼핑 시장규모는 46.9조원으로 전년비 25.2% 성장했습니다. 전분기 44.9조원, 21.8%보다 성장률이 더욱 더 커지고 있습니다. 쇼핑몰의 이용자 수가 늘어남에 따라 상품에 달리는 후기와 댓글의 수가 기하급수적으로 늘고 있습니다. 유명 의류 온라인 쇼핑몰의 상의 의류 제품들의 경우 제품 후기 개수가 약 1,000개에 육박하고 있으며, 1,000개 이상의 상품 문의 글을 보유하고 있습니다. 그러나 많은 제품의 모든 댓글과 리뷰를 읽을 수는 없기 때문에 제품에 대해 객관적인 판단이 힘들어졌습니다. 또한 자영업자들의 플랫폼 입점이 늘어나 경쟁이 과열 양상을 보이는 것.. TIL/프로젝트 2023. 1. 16. cnn미니프로젝트 제출용 질문답변! Q1. Convolution의 원리는 무엇인가요? kernel을 사용하여 각 요소별 가중치를 줘서 특징을 추출한다는 것이다 데이터의 특징을 추출하는 과정. 데이터에 각 성분의 인접 성분들을 조사해 특징을 파악하고 파악한 특징을 한장으로 도출시키는 과정. 도출된 층을 Convolution Layer라고 함. 이 과정은 하나의 압축 과정이며 파라미터의 갯수를 효과적으로 줄여주는 역할을 함. Convolution 에서 사용되는 몇 가지 용어로는 필터는 커널(kernel)이라고 불리기도 합니다. 간격(stride)은 한 필터에서 다음 필터로 갈 때 몇 칸을 띄어서 가는지 패딩(zero padding)은 양 옆으로 몇 개씩의 0을 붙일지 Q2. Convolution층에서 padding의 역할을 설명해주세요 만약 .. TIL/프로젝트 2022. 12. 11. 데이터 분석가에게 ML기술질문으로 자주 등장하는 질문들 1) Cross Validation은 무엇이고 어떻게 해야하나요? 교차검증은 훌련데이터로 모델이 잘 훈련되었는지를 검증데이터를 사용해 검증하는 방법중 하나로 보통 훈련 데이터로 모델을 훈련한 후, 검정 데이터를 사용해 모델이 어떻게 검증되나를 지켜보며 그에 따라 모델의 하이퍼 파라미터를 조정하고 모델의 성능을 올립니다.이때 사용하는 검정 데이터가 한 세트밖에 없다면 검정 데이터로 직접 모델을 훈련하지 않더라도 검정 데이터에 모델이 과적합 될 수 있습니다. 과적합을 피하면서 파라미터를 튜닝하고 일반인 모델을 만들고 더 신뢰성 있는 모델 평가를 진행하기 위해서 사용됩니다 쉽게 말해 데이터를 여러 번 반복해서 나누고 여러 모델을 학습하여 성능을 평가하는 방법입니다 장점 단점 특정 데이터셋에 대한 과적합 방지 .. TIL/프로젝트 2022. 11. 26. 이전 1 다음 728x90