개요

https://drive.google.com/file/d/1jehuH5_gSXMT43cxamB8TffX3lGQ2TNi/view



시각화



딥러닝

모든 단어에 대해 숫자로 매핑함 -> 단어에 대해 원-핫 인코딩 -> 차원의 저주 !!

object자료형을 숫자형으로 바꾸는게 중요함! 


df['gender'] = le.fit_transform(df['gender'])
 
이 코드와 같다.

원핫 인코딩



딥러닝 모델 개발 

 

validation loss가 적어질때만 저장해서 최고의 성능 모델 학습을 시킬 수 있음


## Feature Engineering 통한 성능향상
+ 불균현 Churn 데이터 균형 맞추기 : OverSampling, UnderSampling
+ OverSampling 기법 : SMOTE(Synthetic Minority Over-sampling Technique)

주황색의 y값이 얼마 없으니 늘려줌 -> oversampling

 

재현율을 높이게 되면 정확도가 떨어지고

정확도를 높이면 정확도가 떨어지는 trade-off 관계이다 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

개요

https://drive.google.com/file/d/1jehuH5_gSXMT43cxamB8TffX3lGQ2TNi/view

1. IRIS_머신러닝_딥러닝_템플릿_문제

https://colab.research.google.com/drive/10sb5R3DT8kH6Pp6kWysA0JBXb8Giq8Wi?usp=sharing#scrollTo=M5rch0yM9c1b 


 

원핫 인코딩


4교시