[빅데이터 분석기사] 실기 6회

🏆 자격증, 어학

[빅데이터 분석기사] 실기 6회 - 2유형 macro

데이터팍스 2024. 8. 20. 17:53

2유형은 그냥 그대로 따라하기만 하면 된다 그냥 방식을 암기하자

아래의 내용은 안 보고 그냥 생각나는 과정을 쭉 써봤다 이 과정이 생각 난다면 2유형은 푸는데 문제없다

데이터를 x_train, x_test, y_train으로 분리한다
x_train, x_test, y_train의 shape 확인 ☞ 행,열 개수 확인 ☞x_train과 x_test의 칼럼 개수가 일치한지 확인
x_train, x_test, y_train의 info 확인 ☞ 데이터 타입 확인 ☞ object, category 있을 경우 원핫 인코딩
x_train, x_test, y_train의 head 확인 ☞ 데이터 어떻게 생겼는지 한번 직접 본다
x_train, x_test, y_train의 describe 확인 ☞ x_train, x_test의 기초통계량 확인 ☞ min, max가 크게 차이나는지 이상치 확인
x_train, x_test, y_train의 is.null().sum() 확인 ☞결측치 있는지 확인
x_train, x_test 의 ID 제거 ☞ ID=x_test['ID'].copy() 하고 x_train과 x_test의 ID 를 drop
x_train, x_test 원핫 인코딩 적용 ☞ x_train=pd.get_dummies(x_train) ☞ x_train.info() ☞ 원핫 인코딩 후에 칼럼 개수와 순서가 일치한지 꼭 확인
x_train, y_train 데이터 분리 ☞ from sklearn.model_selection import train_test_split 으로 데이터 분리 ***분류분석일경우, 데이터 분리할떄 stratify = y_train 층화 옵션 꼭 넣어줘야함***
x_train,y_trian 데이터 훈련 ☞ from sklearn.ensemble import RandomForestClassifer
예측 데이터 만들기 ☞ y_pred=model.predict(x_val)
주어진 평가지표로 y_val, y_pred 넣어서 구해보기 ☞ from sklearn.metrics import f1_score
x_test를 넣어서 결과값 만들기 ☞ y_result=model.predict(x_test)
제출할 DataFrame 만들기 ☞ result=pd.DataFrame({'ID':ID,'Target':y_result})
csv로 제출하기 ☞ result.to_csv('datafox.csv',index=False)
데이터 불러서 확인해보기 ☞df2= pd.read_csv("datafox.csv") ☞ print(df2.head(10))

6회에서 중요한건

분류분석 했을때 y값이 이진분류가 아니라서 f1_score 구할때 꼭 average='macro'를 넣어줘야 함

y_pred=model.predict(x_val)
from sklearn.metrics import f1_score
f1=f1_score(y_val,y_pred, average='macro')
print(f1)

'🏆 자격증, 어학' 카테고리의 다른 글

[빅데이터 분석기사] 실기 4회 - 2유형 결측치 대체,drop (0)	2024.08.20
[빅데이터 분석기사] 실기 5회 - 2유형 x_train과 x_test 개수가 다를때 reindex 사용 (0)	2024.08.20
[빅데이터 분석기사] 실기 7회 - 2유형 RandomForestRegressor (0)	2024.08.20
[빅데이터 분석기사] 실기 2회 - 1유형 이상치 (1)	2024.08.19
[빅데이터 분석기사] 실기 2회 - 1유형 sort_values (0)	2024.08.19

현재글[빅데이터 분석기사] 실기 6회 - 2유형 macro

DATAFOX🦊

데이터 분석을 박스에 담는 블로그📦 네이버 블로그에서 이전중

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

DATAFOX🦊

[빅데이터 분석기사] 실기 6회 - 2유형 macro

'🏆 자격증, 어학' 카테고리의 다른 글

'🏆 자격증, 어학'의 다른글

티스토리툴바

﻿[빅데이터 분석기사] 실기 6회 - 2유형 macro

'🏆 자격증, 어학' 카테고리의 다른 글

'🏆 자격증, 어학'의 다른글

관련글

티스토리툴바

[빅데이터 분석기사] 실기 6회 - 2유형 macro