๐Ÿ† ์ž๊ฒฉ์ฆ, ์–ดํ•™

[๋น…๋ฐ์ดํ„ฐ ๋ถ„์„๊ธฐ์‚ฌ] ์‹ค๊ธฐ 7ํšŒ - 1์œ ํ˜• ์ƒ๊ด€๊ณ„์ˆ˜

๋ฐ์ดํ„ฐํŒ์Šค 2024. 8. 19. 16:42

 

๋Œ€ํ‘œ์‚ฌ์ง„ ์‚ญ์ œ
 

์‚ฌ์ง„ ์„ค๋ช…์„ ์ž…๋ ฅํ•˜์„ธ์š”.

๊ธฐ์ถœ ํ’€๋‹ค๊ฐ€ ๋ชจ๋ฅด๋Š” ๋ฌธ์ œ ๋ฐœ๊ฒฌ

์ƒ๊ด€๊ณ„์ˆ˜๋ฅผ ์–ด๋–ป๊ฒŒ ๊ตฌํ•˜๋Š”์ง€ ์•„์˜ˆ ๋ชฐ๋ผ์„œ ์œ ํŠœ๋ธŒ์˜ ๋„์›€์„ ๋ฐ›์•˜๋‹ค

์•„๋ž˜ ์˜์ƒ ์ฐธ๊ณ 

https://youtu.be/-TUEm_JnlPg?si=TVc7pad-JpPu6IBJ

 

 

์ด ์˜์ƒ์„ ๋ณด๊ณ  ์–ด๋–ป๊ฒŒ ํ‘ธ๋Š”์ง€ ๊ฐ์„ ์žก์•˜๋‹ค

 
์‚ฌ์ง„ ์‚ญ์ œ

์‚ฌ์ง„ ์„ค๋ช…์„ ์ž…๋ ฅํ•˜์„ธ์š”.

๋ฌธ์ œ : var_11 ์ปฌ๋Ÿผ๊ณผ ์ƒ๊ด€๊ณ„์ˆ˜์˜ ์ ˆ๋Œ“๊ฐ’์ด ๊ฐ€์žฅ ํฐ ๋ณ€์ˆ˜๋ฅผ ์ฐพ์•„ ํ•ด๋‹น ๋ณ€์ˆ˜์˜ ํ‰๊ท ๊ฐ’์„ ๊ตฌํ•˜์—ฌ๋ผ

์ฝ”๋“œ ํ•ด์„

df.corr() : df ํ•จ์ˆ˜์˜ ์ƒ๊ด€๊ณ„์ˆ˜ ๋งคํŠธ๋ฆญ์Šค๋ฅผ ์ „๋ถ€ ๋ถˆ๋Ÿฌ์˜ด

df.corr()['var_11'] : df.corr ํ•จ์ˆ˜์—์„œ var_11๊ฐ’๋งŒ ๊ฐ€์ ธ์˜ด

df.corr()['var_11'].abs() : abs๋Š” ์ ˆ๋Œ“๊ฐ’์„ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜, ๊ทธ๋Ÿฌ๋ฏ€๋กœ ๋’ค์— ๋ง๋ถ™์ด๋ฉด var_11 ์นผ๋Ÿผ์— ์ „๋ถ€ ์ ˆ๋Œ“๊ฐ’์„ ์”Œ์›Œ์ฃผ๊ฒŒ ๋จ

abs.corr()['var_11'].abs().sort_values() : sort_values ๊ธฐ๋ณธ๊ฐ’์ด ascending=true๋กœ ๋˜์–ด์žˆ๋Š” ์˜ค๋ฆ„์ฐจ์ˆœ ์ •๋ ฌ

abs.corr()['var_11'].abs().sort_values().index[-2] : ์ธ๋ฑ์Šค ๋’ค์—์„œ๋ถ€ํ„ฐ ๋‘๋ฒˆ์งธ์ธ๊ฑฐ๋ฅผ ๊ฐ€์ ธ์˜ด

>> ๋’ค์—์„œ ์ฒซ๋ฒˆ์งธ์ธ๊ฒŒ ์•„๋‹Œ ์ด์œ ๋Š” ๋งจ ๋งˆ์ง€๋ง‰ ๊ฐ’์€ var_11 ์ž๊ธฐ ์ž์‹ ๊ณผ์˜ ์ƒ๊ด€๊ณ„์ˆ˜ ๊ฐ’์ž„

>> ๊ทธ๋Ÿฌ๋ฏ€๋กœ var_28์„ ๊ฐ€์ ธ์˜ด

 

์ดํ›„ df['var_28'].mean() ํ•ด์ฃผ๋ฉด ํ‰๊ท ๊ฐ’์ด ๋‚˜์˜ด!