๐ฆ๋ถ์ ํ๋ก์ ํธ/๐
ํฌ๋กค๋ง ๋ถ์
๐ ํฌ๋กค๋ง ๋ถ์ ํ๋ก์ ํธ (3) - RSS ํ์ฉ ๋ด์ค ํฌ๋กค๋ง
๋ฐ์ดํฐํ์ค
2024. 10. 17. 16:21
RSS๋?
- RSS(Really SImpel Syndication)๋ ์น ์ฌ์ดํธ์์ ์ปจํ ์ธ ๋ฅผ ์ฌ์ฉ์์๊ฒ ์ฝ๊ฒ ๋ฐฐํฌํ๊ธฐ ์ํ ํ์ค ํฌ๋งท์ ๋๋ค.
- RSS๋ฅผ ์ฌ์ฉํ๋ฉด ์ฌ์ฉ์๋ ํด๋น ์น ์ฌ์ดํธ๋ฅผ ๋ฐฉ๋ฌธํ์ง ์์๋ ํด๋น ์ฌ์ดํธ์ ์ ๋ฐ์ดํธ๋ ๋ด์ฉ์ ํ์ธํ ์ ์๊ธฐ ๋๋ฌธ์, ํฌ๋กค๋ง๊ณผ ์ ์ฌํ์ง๋ง ํจ์ฌ ์ฝ๋ค๊ณ ํ ์ ์๋ค.
- RSS๋ ์ฌ์ฉ์๊ฐ ๊ด์ฌ ์๋ ์น ์ฌ์ดํธ์ ์ ๋ฐ์ดํธ๋ฅผ ๋ฐ์๋ณด๊ณ ์ ํ ๋ ์ฌ์ฉ๋๋ ๊ฒ์ด๊ณ , ํฌ๋กค๋ง์ ์น ์ฌ์ดํธ์ ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ์์งํ๊ณ ๋ถ์ํ๊ธฐ ์ํด ์ฌ์ฉํฉ๋๋ค.
- ๋ชฉ์ ๊ณผ ๋ฐฉ๋ฒ์์ ์ฐจ์ด๊ฐ ์์ง๋ง, ๋ ๋ค ์น ์ฝํ ์ธ ๋ฅผ ๊ฐ์ ธ์ค๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ ๋๋ค.
RSS ํ์ฉํด์ ๋ด์ค ๋ฐ์ดํฐ ํฌ๋กค๋ง ํ๊ธฐ
import feedparser
import pandas as pd
url='https://news.sbs.co.kr/news/SectionRssFeed.do?sectionId=01&plink=RSSREADER'
feed=feedparser.parse(url)
# ๋น ๋ฆฌ์คํธ ์ ์
url_list=[]
title_list=[]
summary_list=[]
date_list=[]
#feed entries ์ํํ๋ฉด์ ๋ฆฌ์คํธ์ ๊ฐ ์ถ๊ฐ
for entry in feed.entries:
url_list.append(entry.link)
title_list.append(entry.title)
summary_list.append(entry.summary)
date_list.append(entry.published)
data={'๋ด์คurl':url_list,'์ ๋ชฉ':title_list,'๋ด์ฉ์์ฝ':summary_list,'๋ ์ง':date_list}
df=pd.DataFrame(data)
์ด ์ฝ๋๋ฅผ ํตํด ์ค์๊ฐ์ผ๋ก ๊ฐ์ฅ ๋น ๋ฅธ ๋ด์ค๋ฅผ ๊ฐ์ ธ์ฌ ์ ์๋ค.