로지스틱 회귀분석을 만났을땐
# 독립변수, 종속변수 할당
x=df.drop(coloumns=['칼럼명1') 혹은 x=df[['칼럼명1','칼럼명2','칼럼명3']]
y=df['칼럼명']
statsmodels 과 sklearn 방식중 무엇으로 풀지 선택
# sklearn로 푸는 방식
import pandas as pd
import numpy as nnp
from stats.linear_model import LogisticRegression
model=LogisticRegression(penalty=None) #None을 꼭 넣어야함
model.fit(x,y)
np.round(model.coef_,2) # 회귀계수
# statsmodels로 푸는 방식
import pandas as pd
import numpy as np
import statsmodels.api as sm
x=sm.add_constant(x)
model=sm.Logit(y,x).fit()
summary=model.summary()
print(summary)
'🏆 자격증, 어학' 카테고리의 다른 글
[빅데이터 분석기사] 빅분기 실기 8회 후기, 복원문제, 데이터, 예상 답안 코드 (56) | 2024.08.21 |
---|---|
[빅데이터 분석기사] 실기 - 3유형 카이제곱검정 (0) | 2024.08.21 |
[빅데이터 분석기사] 실기 - 3유형 다중회귀분석, 상관분석 (0) | 2024.08.21 |
[빅데이터 분석기사] 실기 6회 - 3유형 predict (0) | 2024.08.21 |
[빅데이터 분석기사] 실기 6회 - 3유형 카이제곱 독립성 검정 (0) | 2024.08.21 |