๐Ÿ Python/์˜จ๋ผ์ธ ๊ฐ•์˜

[๋ฉ”ํƒ€์ฝ”๋“œ] ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ž…๋ฌธ Python ๋ถ€ํŠธ์บ ํ”„ 3-07 ๋ฌธ์ œํ’€์ด

๋ฐ์ดํ„ฐํŒ์Šค 2024. 8. 14. 16:26

์—ฐ์Šต๋ฌธ์ œ: Titanic ๋ฐ์ดํ„ฐ์…‹์„ ์ด์šฉํ•œ ๊ทธ๋ฃนํ™” ๋ฐ ์ง‘๊ณ„

  • Titanic ๋ฐ์ดํ„ฐ์…‹์„ ์ด์šฉํ•˜์—ฌ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜๋Š” Pandas ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜์‹ญ์‹œ์˜ค.
    • ๋ฐ์ดํ„ฐ๋ฅผ 'Pclass' (๊ฐ์‹ค ๋“ฑ๊ธ‰)๋ณ„๋กœ ๊ทธ๋ฃนํ™”ํ•˜๊ณ , ๊ฐ ๊ทธ๋ฃน์— ๋Œ€ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ง‘๊ณ„ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜์‹ญ์‹œ์˜ค:
      • Survived ์ปฌ๋Ÿผ์˜ ํ•ฉ๊ณ„ (์ƒ์กด์ž ์ˆ˜).
      • Fare ์ปฌ๋Ÿผ์˜ ํ‰๊ท  (ํ‰๊ท  ์š”๊ธˆ).
      • Embarked ์ปฌ๋Ÿผ์˜ ๊ณ ์œ ๊ฐ’ ์ˆ˜ (์ถœ๋ฐœํ•œ ํ•ญ๊ตฌ์˜ ์ข…๋ฅ˜ ์ˆ˜).
    • ๊ฒฐ๊ณผ๋ฅผ ์ƒˆ๋กœ์šด DataFrame์œผ๋กœ ์ €์žฅํ•˜๊ณ , ๊ทธ๋ฃนํ™”ํ–ˆ๋˜ 'Pclass' ์ปฌ๋Ÿผ์„ ๋‹ค์‹œ DataFrame์˜ ์ปฌ๋Ÿผ์œผ๋กœ ๋ณ€ํ™˜ํ•˜์‹ญ์‹œ์˜ค (์ฆ‰, reset_index()๋ฅผ ์‚ฌ์šฉ).
import seaborn as sns
df=sns.load_dataset('titanic')
import pandas as pd
df.groupby(by='pclass').agg(
    survived_sum=('survived','sum')
    ,fare_mean=('fare','mean')
    ,embarked_=('embarked','nunique')
).reset_index()

 

aggregation ํ•จ์ˆ˜๋ฅผ ์“ฐ๋ฉด ๋‚˜๋ˆ„์ง€ ์•Š๊ณ  ํ•˜๋‚˜์˜ ์ฝ”๋“œ์— ์—ฌ๋Ÿฌ ์ง‘๊ณ„ํ•จ์ˆ˜๋ฅผ ๋„ฃ์„ ์ˆ˜ ์žˆ๋‹ค