[๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ] ์ค๊ธฐ 4ํ - 1์ ํ str.contains, strftime, astype('datetime64[ns]')
๋ฌธ์
**date_added๊ฐ 2018๋ 1์ ์ด๋ฉด์ country๊ฐ United Kingdom ๋จ๋ ์ ์์ธ ๋ฐ์ดํฐ์ ๊ฐฏ์**

์ฌ์ง ์ค๋ช ์ ์ ๋ ฅํ์ธ์.
๋ฐ์ดํฐ๊ฐ ์ด๋ ๊ฒ ์๊ฒจ๋จน์์ date_added์ '์'์ด ์ซ์๊ฐ ์๋ ์์ด๋ก ๋์ด์์ใ ใ ใ ใ
๋ณด์๋ง์ ์.. str.contains() ๋๋์ด ์จ๋จน์์ ์๋ ์๊ฐํจ
์ค๊ธฐ 5ํ - 1์ ํ str ๊ธ ์ฐธ๊ณ

์ํ๋ ์นผ๋ผ๋ง ์ ํํ๊ณ ์ถ์๋ฐ ํ๋ ๋ฐฉ๋ฒ์ ๋ชฐ๋ผ์ ์ผ๋จ ๋ ธ๊ฐ๋ค๋ก ๊ตฌํจ... ํ์ด๋ฅผ ๋ดค๋ค ??? for๋ฌธ์ด ์ ๋...
blog.naver.com
cond1=(df['date_added'].str.contains('January'))
cond2=(df['date_added'].str.contains('2018'))
cond3=(df['country']=='United Kingdom')
len(df[cond1&cond2&cond3])
๋๋ ์ด๋ ๊ฒ ํ์๋๋ฐ ํ์ด ๋ฐฉ์์ ์์ ๋ฌ๋๋ค
result = df[(df.date_added_dt.dt.strftime("%Y-%m") =='2018-01') & (df.country =='United Kingdom')].shape[0]
print(result)
ํจ์ ์ฌ์ฉ๋ฒ์ ์๋์ ๊ฐ๋ค
import dateime as dt
๋ฐ์ดํฐ์นผ๋ผ๋ช
.dt.strftime("%Y-%m")
์์ ๋ ๋ค์๊ณผ ๊ฐ๋ค
print(df.strftime('%y%m%d %H%M%S')) # ์๋ถ์ด HMS๋ ๋๋ฌธ์๋ก ๊ธฐ์
(์๋ฌธ์ error)
# 230516 202338
print(df.strftime('%y๋
%m์ %d์ผ %H์ %M๋ถ %S์ด'))
# 23๋
05์ 16์ผ 20์ 23๋ถ 38์ด
print(now.strftime('%Y-%m-%d %H:%M:%S'))
# 2023-05-16 20:23:38
์ด ํจ์๋ฅผ ์จ์ 2018 - 01์ ๋ถ๋ฌ์จ ๊ฒ ๊ฐ์
strftime์ ๋ ์งํ ๋ฐ์ดํฐ์์ ๋ ๊ฐ์ง ์ด์์ ์ ๋ณด๋ฅผ ๋ฌธ์์ด๋ก ํฉ์ณ์ ํ์์ ๋ง๋ค ๋ ์ ์ฉํ๋ค๊ณ ํจ
์ด๋์ผ ๊ทผ๋ฐ ๋ ๋ค๋ฅธ ํ์ด๊ฐ ์์..
date = df['date_added'].astype('datetime64[ns]')
cond1 =( date >= '2018-01-01')
cond2 =( date <= '2018-01-31')
6ํ 1์ ํ date time ํ ๋ ๋์๋ ๊ทธ ํจ์๋ค
์๋ ๋งํฌ์์ ๋ณด๋ฉด ๋จ

์ผ๋จ ๋ฐ์ดํฐ ํ์ ํํ๋ถํฐ ์ดํด๋ฅผ ํด์ผํจ ๋ฌธ์ ๊ฐ ๊ตฌ๊ธ ๋ณด๊ณ ์ ๋ณ ์ถ๋์๊ฐ๊ณผ ์ ๊ณ ์๊ฐ์ ์ฐจ์ด๋ฅผ '์...
blog.naver.com
astype('datetime64[ns]')
์ด๊ฑฐ ๊ฑฐ์ ๋ง๋ฅ์ธ๋ฐ..? datetime ํ๋ ์ง์ง ์ ์ฉํ๋ฏ ๊ผญ ๊ธฐ์ตํด๋์