๐Ÿ† ์ž๊ฒฉ์ฆ, ์–ดํ•™

[๋น…๋ฐ์ดํ„ฐ ๋ถ„์„๊ธฐ์‚ฌ] ์‹ค๊ธฐ 3ํšŒ- 2์œ ํ˜• prob

๋ฐ์ดํ„ฐํŒ์Šค 2024. 8. 20. 17:55

 

๋Œ€ํ‘œ์‚ฌ์ง„ ์‚ญ์ œ
 

์‚ฌ์ง„ ์„ค๋ช…์„ ์ž…๋ ฅํ•˜์„ธ์š”.

๋‹ค ์ž˜ ํ•ด๋†“๊ณ  ๋งˆ์ง€๋ง‰์—์„œ ์˜ค๋ฅ˜๊ฐ€ ๋‚ฌ๋‹ค, ์—๋Ÿฌ๋ฅผ ๋ณด๋‹ˆ 1์ฐจ์›์ด ์•„๋‹ˆ๋ž€๋‹ค ๊ทธ๋ž˜์„œ ๋ญ”๊ฐ€ ์‹ถ์–ด์„œ ์ฐพ์•„๋ด„

 

2ํŠน์ • ํด๋ž˜์Šค๋กœ ๋ถ„๋ฅ˜๋  ํ™•๋ฅ ์„ ๊ตฌํ•  ๊ฒฝ์šฐ (predict_proba)๋ฅผ ์‚ฌ์šฉํ•˜๋Š”๋ฐ

y_result_prob = model.predict_proba(x_test) ์—ฌ๊ธฐ๊นŒ์ง„ ๋งž์Œ์Œ

 

 

๊ทผ๋ฐ ์—ฌ๊ธฐ์„œ prob๋ฅผ ์ข€ ๋” ์ดํ•ดํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค

๋‹ค๋ฅธ ์˜ˆ์ œ๋ฅผ ๋“ค๋ฉด

 
์‚ฌ์ง„ ์‚ญ์ œ

์‚ฌ์ง„ ์„ค๋ช…์„ ์ž…๋ ฅํ•˜์„ธ์š”.

result_prob	=	pd.DataFrame({	
				'result':	y_result,
				'prob_0':	y_result_prob[:,0], 
				'prob_1':	y_result_prob[:,1], 
				'prob_2':	y_result_prob[:,2] 
})
 

y_result_prob์—๋Š” ๋ถ„๋ฅ˜๋œ ํด๋ž˜์Šค ๊ฐ’ ๊ทธ์— ์†ํ•  ํ™•๋ฅ ๊ฐ’์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐ์ธ๊ฑฐ์ž„!!

# Class 0์ผ ํ™•๋ฅ  : y_result_prob[:,0]

# Class 1์ผ ํ™•๋ฅ  : y_result_prob[:,1]

# Class 2์ผ ํ™•๋ฅ  : y_result_prob[:,2]

 

๋ฌธ์ œ์—์„œ travelInsurance๊ฐ€ 1์ผ ํ™•๋ฅ ์„ ๊ตฌํ•ด์„œ ์ œ์ถœํ•˜๋ผ ์•„๋ž˜ ์‹์ฒ˜๋Ÿผ ์จ์•ผ ํ–ˆ๋˜ ๊ฒƒ์ด๋‹ค

y_result_prob	=	model.predict_proba(x_test)
result=pd.DataFrame({'ID':ID, 'proba':y_result_prob[:,1]})
result.to_csv('datafox',index=False)
pd.read_csv("datafox")
 

์ด๋Ÿฌ๋ฉด ์˜ค๋ฅ˜์—†์ด ์ž˜ ๋‚˜์˜จ๋‹น