전체 글97 딥러닝 이해 2021. 7. 13. Regularization 관련 유튜브 영상 [핵심 머신러닝] 정규화모델 1(Regularization 개념, Ridge Regression) Good model이 뭘까 ? 1) 현재데이터 (traning data)를 잘 설명하는 모델 Expected MSE = Error + Bias^2 + Variance 2) 미래 데이터(testing data)에 대한 예측 성능이 좋은 모델 정규화 1번 2번 3번 중 가장 좋은 모델은 ?? 1번 - > Bias가 큼 3번 - > Variance가 큼 2번 - > 적합함 2021. 7. 11. 데이터 전처리, 릿지, 라쏘, 선형회귀,SST 결측치 처리 1) 결측치를 적절한 값으로 대체 -> 어떤 값으로 대체할지를 선택해야함 2) NA처리-> 결측값이 많은경우 무시할 수 없음 3) 아무것도 하지 않음 틀린값 처리 1) 모두 버리거나 2) 적절한 값으로 대체 3) 프로그램에 의해 찾아냄 이상치 처리 : 값의 범위가 일반적인 범위를 벗어나 특별한 값을 갖는 것 - 이상치를 찾아내는 것을 이상치 검출 이라고함 데이터 변환 1) 범주형으로 변환 (Binning) 2) 일반 정규화 3) z-score 정규화 (평균을0 표준편차를1) 4) 로그변환 : 수치값에 로그를 취한 값을 사용하는 것 (로그 정규 분포) 5) 역수 변환 : 역수를 사용하면 오히려 선형적인 특성을 가지게 되어 의미를 해석하기 쉬워지는 경우도 있음 6) 데이터 축소 7) 샘플링 8).. 2021. 7. 9. 사이킷런으로 수행하는 타이타닉 생존자 예측 DACON - 주차 수요 예측 AI 경진대회 ----------------------------------------------------- > [예제] 사이킷런으로 수행하는 타이타닉 생존자 예측 예측 -> 평가 -> 최적화 # - Model 학습, 예측, 정확도 평가 : DecisionTreeClassifier, RandomForest.. 2021. 7. 8. 이전 1 2 3 4 ··· 25 다음