괴발개발

인공지능4(titanic) ( data preprocessing, fit(), predict()) 본문

Study/인공지능

인공지능4(titanic) ( data preprocessing, fit(), predict())

yousim 2021. 10. 22. 13:48

data processing : 타이타닉호의 생존자 예측에서

학습용 데이터에 빈 데이터에 대한 보정이나 문자열 데이터를 변환하는것

 

- Missing Data Handleing (결손 데이터) 

빈 데이터 / 의미 없는 데이커가 있을 경우, 학습에 필요한 임의의 값으로 바꾸는 것. 

isna() : 주어진 변수가 NaN인지 판단

fillna() : 주어진 변수가 NaN인 경우 다른 값으로 채워넣음 

Standard Scaler : 정규분포를 가진 데이터들을 0을 평균으로 하고 1을 분산으로하는 표준화 시키다.
MinMaxScaler : 가우시안 정규분포를 가지지 않는 데이터들을 0과 1사이의 값으로 표준화 한다.

 

지도학습( Supervised Learning)은 학습하는 fit()와, 예측하는 predict()를 가진다.

비지도학습( Unsupervised Learning)도 fit()과 predict()를 가진다. 

 

  • Estimator
    • 학습: fit()
    • 예측: predict()
  • 분류 (Classifier)
    • DecisionTreeClassifier
    • RandomForestClassifier
    • GradientBoostingClassifier
    • SVC
  • 희귀 (Regressor)
    • LinearRegression
    • Ridge
    • Lasso
    • RandomForestRegressor
    • GradientBoostingRegressor