๐ ์๊ฒฉ์ฆ, ์ดํ
[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ 2ํ - 1์ ํ sort_values
๋ฐ์ดํฐํ์ค
2024. 8. 19. 16:50
๋ฌธ์
์ฃผ์ด์ง Dataset์์ CRIM๊ฐ์ด ๊ฐ์ฅ ํฐ 10๊ฐ์ ์ง์ญ์ ๊ตฌํ๊ณ
10๊ฐ์ ์ง์ญ์ CRIM๊ฐ์ ๊ทธ ์ค ๊ฐ์ฅ ์์ ๊ฐ์ผ๋ก ๋์ฒดํ๋ผ. ๊ทธ๋ฆฌ๊ณ
AGE ์ปฌ๋ผ ๊ฐ์ด 80์ด์์ธ ๋์ฒด ๋ CRIM ํ๊ท ๊ฐ์ ๊ตฌํ๋ผ
min=df.sort_values('CRIM',ascending=False).reset_index(drop=True).iloc[:10]['CRIM'].min()
import numpy as np
df['CRIM'] = np.where(df['CRIM']>=min, min, df['CRIM'])
df[df['AGE']>=80]['CRIM'].mean()
์ฝ๋๊ฐ ๋ค๋ฅธ๋ถ๋ถ์ด ๋ฑ ํ๋ ์๋๋ฐ
๋๋ crim๊ฐ์ด min๋ณด๋ค ํฐ ๊ฐ์ ๋ค min์ผ๋ก ์๋๊ฑด crim๊ฐ ๊ทธ๋๋ก ๋๋ np.where ํจ์๋ฅผ ์ผ๊ณ
์ฌ๊ธฐ์๋ loc๋ฅผ ์ด์ฉํด์ df์ ์นผ๋ผ์ crim, 0~9ํ ๊น์ง ๊ฐ์ ๋ชจ๋ min์ผ๋ก ๋ฐ๋ก ๋ฃ๋ ๊ฒ์ ์ฌ์ฉํ๋ค
df.loc[:9,'CRIM'] = df.loc[:9,'CRIM'].min()
df['CRIM'] = np.where(df['CRIM']>=min, min, df['CRIM'])