
์ฌ์ง ์ค๋ช ์ ์ ๋ ฅํ์ธ์.
๊ธฐ์ถ ํ๋ค๊ฐ ๋ชจ๋ฅด๋ ๋ฌธ์ ๋ฐ๊ฒฌ
์๊ด๊ณ์๋ฅผ ์ด๋ป๊ฒ ๊ตฌํ๋์ง ์์ ๋ชฐ๋ผ์ ์ ํ๋ธ์ ๋์์ ๋ฐ์๋ค
์๋ ์์ ์ฐธ๊ณ
์ด ์์์ ๋ณด๊ณ ์ด๋ป๊ฒ ํธ๋์ง ๊ฐ์ ์ก์๋ค
์ฌ์ง ์ค๋ช ์ ์ ๋ ฅํ์ธ์.
๋ฌธ์ : var_11 ์ปฌ๋ผ๊ณผ ์๊ด๊ณ์์ ์ ๋๊ฐ์ด ๊ฐ์ฅ ํฐ ๋ณ์๋ฅผ ์ฐพ์ ํด๋น ๋ณ์์ ํ๊ท ๊ฐ์ ๊ตฌํ์ฌ๋ผ
์ฝ๋ ํด์
df.corr() : df ํจ์์ ์๊ด๊ณ์ ๋งคํธ๋ฆญ์ค๋ฅผ ์ ๋ถ ๋ถ๋ฌ์ด
df.corr()['var_11'] : df.corr ํจ์์์ var_11๊ฐ๋ง ๊ฐ์ ธ์ด
df.corr()['var_11'].abs() : abs๋ ์ ๋๊ฐ์ ๊ตฌํ๋ ํจ์, ๊ทธ๋ฌ๋ฏ๋ก ๋ค์ ๋ง๋ถ์ด๋ฉด var_11 ์นผ๋ผ์ ์ ๋ถ ์ ๋๊ฐ์ ์์์ฃผ๊ฒ ๋จ
abs.corr()['var_11'].abs().sort_values() : sort_values ๊ธฐ๋ณธ๊ฐ์ด ascending=true๋ก ๋์ด์๋ ์ค๋ฆ์ฐจ์ ์ ๋ ฌ
abs.corr()['var_11'].abs().sort_values().index[-2] : ์ธ๋ฑ์ค ๋ค์์๋ถํฐ ๋๋ฒ์งธ์ธ๊ฑฐ๋ฅผ ๊ฐ์ ธ์ด
>> ๋ค์์ ์ฒซ๋ฒ์งธ์ธ๊ฒ ์๋ ์ด์ ๋ ๋งจ ๋ง์ง๋ง ๊ฐ์ var_11 ์๊ธฐ ์์ ๊ณผ์ ์๊ด๊ณ์ ๊ฐ์
>> ๊ทธ๋ฌ๋ฏ๋ก var_28์ ๊ฐ์ ธ์ด
์ดํ df['var_28'].mean() ํด์ฃผ๋ฉด ํ๊ท ๊ฐ์ด ๋์ด!
'๐ ์๊ฒฉ์ฆ, ์ดํ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ - iloc (0) | 2024.08.19 |
---|---|
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ 6ํ - 1์ ํ for๋ฌธ (0) | 2024.08.19 |
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ 6ํ - 1์ ํ groupby (0) | 2024.08.19 |
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ 6ํ - 1์ ํ datetime, astype('datetime64[ns]') (0) | 2024.08.19 |
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ 7ํ - 1์ ํ ์ด์์น (0) | 2024.08.19 |