πŸ† 자격증, μ–΄ν•™

[빅데이터 뢄석기사] μ‹€κΈ° 6회 - 1μœ ν˜• groupby

λ°μ΄ν„°νŒμŠ€ 2024. 8. 19. 16:45

 

문제

```{admonition} 1-2

**학ꡐ μ„ΈλΆ€μœ ν˜•μ΄ μΌλ°˜μ€‘ν•™κ΅μΈ 학ꡐ듀 쀑 μΌλ°˜μ€‘ν•™κ΅ μˆ«μžκ°€ 2번째둜 λ§Žμ€ μ‹œλ„μ˜ μΌλ°˜μ€‘ν•™κ΅ λ°μ΄ν„°λ§Œ ν•„ν„°ν•˜μ—¬ ν•΄λ‹Ή μ‹œλ„μ˜ ꡐ원 ν•œλͺ… λ‹Ή 맑은 ν•™μƒμˆ˜κ°€ κ°€μž₯ λ§Žμ€ 학ꡐλ₯Ό μ°Ύμ•„μ„œ ν•΄λ‹Ή ν•™κ΅μ˜ κ΅μ›μˆ˜λ₯Ό 좜λ ₯ν•˜λΌ**

```

 

λŒ€ν‘œμ‚¬μ§„ μ‚­μ œ

사진 μ„€λͺ…을 μž…λ ₯ν•˜μ„Έμš”.

'μ‹œλ„'둜 groupby ν•œ λ‹€μŒμ— μ–΄λ–»κ²Œ 개수λ₯Ό ν™•μΈν•˜μ§€??? λΌλŠ” 생각이 λ“€μ–΄κ°€μ§€κ³ 

groupby ν•œ λ‹€μŒμ— 크기 λ³΄λŠ” ν•¨μˆ˜ μ°Ύμ•„μ„œ 막 μ„œμΉ˜ν•˜κ³  λ‹€λ…”μŒ size() λ₯Ό μ°Ύμ•„λ‚΄μ„œ ν–ˆμ—ˆλŠ”λ°

value_counts()λ‘œλ„ 됐던 κ±°λ‹€..

df=df[df['ν•™κ΅μ„ΈλΆ€μœ ν˜•']=='μΌλ°˜μ€‘ν•™κ΅']
df.groupby(['μ‹œλ„']).value_counts()
 

μ΄λ ‡κ²Œ ν•˜λ©΄ 'μ‹œλ„'κ°€ 인덱싱이 μ•ˆλ˜μ–΄μ„œ μ΄μƒν•œ 값이 λ‚˜μ™”κ³ 

 

df=df[df['ν•™κ΅μ„ΈλΆ€μœ ν˜•']=='μΌλ°˜μ€‘ν•™κ΅']
df.groupby(['μ‹œλ„'])['μ‹œλ„'].value_counts()
 

μ΄λ ‡κ²Œ ν•˜λ©΄ 'μ‹œλ„'κ°€ 인덱싱이 λ˜μ–΄μ„œ μ›ν•˜λŠ” 값이 λ‚˜μ˜¨λ‹€

 

이후 ν’€μ΄λŠ” λ‚΄ 풀이가 더 κ°„λ‹¨ν•΄μ„œ λ‚΄κ°€ ν‘ΈλŠ” λ°©μ‹μœΌλ‘œ,,,