from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.service import Service
s = Service('c:/users/smile/desktop/chromedriver.exe')
driver = webdriver.Chrome(service=s)
url='https://class101.net/search?page=1&query=%EC%9C%A0%ED%88%AC%EB%B8%8C&sort=latestOrder'
driver.get(url)
first_sel=driver.find_element(By.CLASS_NAME,"GridList__Container-sc-1qd26lc-0.ixdUmO")
second_sel=first_sel.find_elements(By.TAG_NAME,"li")
news_title_lists=[]
for a in second_sel:
news_title_lists.append(a.text.split("\n")[1:3])
news_title_lists
import pandas as pd
df=pd.DataFrame(news_title_lists)
df.to_excel('220123.xlsx')
!pip install wordcloud
import sys
from wordcloud import WordCloud
filename=sys.argv[1]
wc=WordCloud(font_path="BMJUA_ttf.ttf")
wc.generate(str(news_title_lists))
wc.to_file('wordcloud_news2.png')
'코딩공부' 카테고리의 다른 글
220123-3 [코딩공부] 네이버금융 많이본뉴스 크롤링 및 워드크라우드 만들기 (0) | 2022.01.23 |
---|---|
220123-2 [코딩공부] 쥬피터 노트북에서 wordcloud 설치 오류시 해결방법 (1) | 2022.01.23 |
220120 [코딩공부] 넷플릭스크롤링 영화제목가져오기 (0) | 2022.01.22 |
220122 [코딩공부] 넷플릭스 크롤링 엑셀 저장하기 (0) | 2022.01.22 |
220121 [코딩공부] 넷플릭스 크롤링-카테고리별 프로그램명 찾기 (0) | 2022.01.22 |
댓글