로지스틱 회귀분석 종속변수가 범주형 자료일 때 적용하는 회귀모델 주택소유여부같은 범주형 레이블은 예측함수를 만들기 어렵기 때문에 평균 소유 비율로 변환한다. 본래의 자료를 확률-> 오즈(odds) -> 로그(log)로 변환하여 선형회귀모델을 적용한 모델이라고 할 수 있다. 1) scikit-learn LogisticRegression은 sklearn.linear_model 안에서 불러온다. LogisticRegression의 하이퍼파라미터는 'C', 디폴트 값은 'C=1'이다. 하위 옵션 중 solver라는 옵션은 연산 속도와 관련된 주요 하이퍼파라미터이다. 데이터양이 수백~수십만 건인 경우 solver='sag'로 설정하면 평균경사하강법을 적용하여 속도를 향상시킬 수 있다. 2) 데이터 준비 impor..