728x90 TIL/머신러닝17 11.09 머신러닝 회귀 스케일링 피처 엔지니어링 상대경로는 현재 경로를 기준으로 하는 경로 EX) / 루트 (가장 최상의 디렉토리로 이동 / Web root) ./ 현재경로를 의미합니다. ../ 상위 경로를 의미합니다. 절대경로는 전체 경로를 다 지정하는 경로 ex) 윈도우 C: 부터 시작하는 경로입니다. 절대경로를 사용하면 다른 사람의 컴퓨터에서 동작하지 않기 때문에 되도록이면 상대경로를 사용하는 것을 권장합니다. 상대경로에서 기본적으로 같은 위치를 뜻하는 키워드는 . 입니다. dt 접근자 관련 참고링크 https://pandas.pydata.org/docs/reference/series.html#datetimelike-properties 로그(Logarithm) log를 count값에 적용하게 되면 한쪽에 너무 뾰족하게 있던 분포가 좀 더 완만한 .. TIL/머신러닝 2022. 11. 10. 11.08 머신러닝 bike log 회귀 - GridSearchCV 하이퍼파라미터 범위를 검사하여 최선의 모델을 선택하려면 GridSearchCV 사용 사용자는 하나 이상의 하이퍼파라미터에 대해 가능성이 있는 값을 정의한다. GridSearchCV는 교차검증을 사용하여 모델을 선택하는 브루트포스(brute-force)한 방법입니다. 지정된 조합만 보기 떄문에 해당 그리드를 벗어나는 곳에 좋은 성능을 내는 하이퍼 파라미터가 있다면 찾지못하는 단점이 있습니다. from sklearn.model_selection import GridSearchCV logistic = linear_model.LogisticRegression() gridsearch = GridSearchCV(logistic, hyperparameters, cv=5, verbose=0).. TIL/머신러닝 2022. 11. 9. 공부한거 정리해보기 배운 꿀팁 정리 1.쥬피터에서 해당셀 글자 일괄변경 esc+f 2.캐글에서 좋은 솔루션 찾는 법 ㄱ) Top 키워드로 검색 ㄴ) 솔루션에 대한 투표수가 많은 것 ㄷ) 프로필 메달의 색상( 왼쪽일수록 높음 - 신뢰도높음) 3.캐클에 제출할 파일명을 valid_accuracy = (y_train == y_valid_pred).mean() 로서 정확도를 측정한후 file_name = f"data/submit_{valid_accuracy:.5f}.csv" 이런식으로 파일명에 정확도 점수를 넣어주면 캐글과 노트북을 왔다갔다하며 점수비교하는 과정의 번거로움을 줄일수 있고 모델을 변경해서 (피처, 하이퍼파라미터 튜닝 등)여러번 예측을 하면 valid점수가 달라지는데 다른 점수와 비교 가능 4.또한 submit 을 지.. TIL/머신러닝 2022. 11. 3. 22.10.31 보호되어 있는 글 입니다. 2022. 10. 31. 22/10/27 공부한 내용정리 머신러닝 딥러닝은 머신러닝의 한종류 범주형 수치형 지도학습 (= 정답이 있음) 분류 (classification) 회귀(regression) 비지도학습 (=정답이 없음) 군집화 (Custering) 차원축소 (Dimensionality reduction) 분류(지도학습) - 범주형 분류예측 ex )고객의 구매여부 ,광고클릭여부, 당뇨병여부 ,코로나 양성 음성, 스펨메일여부 ps/ 구매한다 안한다 ← 있으면 지도학습 없으면 비지도학습 정답 == label == target 회귀분석(지도학습) - 숫자예측 ex)기간별 매출액, 재고량,판매량,강수량,기운 - 회귀 알고리즘 중에 분류에 사용할 수 있는 알고리즘은? 로지스틱회귀 데이터 전처리방법 normalization - 0~1사이값으로 조정 outliers .. TIL/머신러닝 2022. 10. 27. 이전 1 2 다음 728x90