์ฐ์ต๋ฌธ์ : Titanic ๋ฐ์ดํฐ์ ์ ์ด์ฉํ ๊ทธ๋ฃนํ ๋ฐ ์ง๊ณ
- Titanic ๋ฐ์ดํฐ์
์ ์ด์ฉํ์ฌ ๋ค์๊ณผ ๊ฐ์ ์ฐ์ฐ์ ์ํํ๋ Pandas ์ฝ๋๋ฅผ ์์ฑํ์ญ์์ค.
- ๋ฐ์ดํฐ๋ฅผ 'Pclass' (๊ฐ์ค ๋ฑ๊ธ)๋ณ๋ก ๊ทธ๋ฃนํํ๊ณ , ๊ฐ ๊ทธ๋ฃน์ ๋ํด ๋ค์๊ณผ ๊ฐ์ ์ง๊ณ ์ฐ์ฐ์ ์ํํ์ญ์์ค:
- Survived ์ปฌ๋ผ์ ํฉ๊ณ (์์กด์ ์).
- Fare ์ปฌ๋ผ์ ํ๊ท (ํ๊ท ์๊ธ).
- Embarked ์ปฌ๋ผ์ ๊ณ ์ ๊ฐ ์ (์ถ๋ฐํ ํญ๊ตฌ์ ์ข ๋ฅ ์).
- ๊ฒฐ๊ณผ๋ฅผ ์๋ก์ด DataFrame์ผ๋ก ์ ์ฅํ๊ณ , ๊ทธ๋ฃนํํ๋ 'Pclass' ์ปฌ๋ผ์ ๋ค์ DataFrame์ ์ปฌ๋ผ์ผ๋ก ๋ณํํ์ญ์์ค (์ฆ, reset_index()๋ฅผ ์ฌ์ฉ).
- ๋ฐ์ดํฐ๋ฅผ 'Pclass' (๊ฐ์ค ๋ฑ๊ธ)๋ณ๋ก ๊ทธ๋ฃนํํ๊ณ , ๊ฐ ๊ทธ๋ฃน์ ๋ํด ๋ค์๊ณผ ๊ฐ์ ์ง๊ณ ์ฐ์ฐ์ ์ํํ์ญ์์ค:
import seaborn as sns
df=sns.load_dataset('titanic')
import pandas as pd
df.groupby(by='pclass').agg(
survived_sum=('survived','sum')
,fare_mean=('fare','mean')
,embarked_=('embarked','nunique')
).reset_index()
aggregation ํจ์๋ฅผ ์ฐ๋ฉด ๋๋์ง ์๊ณ ํ๋์ ์ฝ๋์ ์ฌ๋ฌ ์ง๊ณํจ์๋ฅผ ๋ฃ์ ์ ์๋ค