728x90
반응형
먼저, 파이썬에서 크롤링을 처음한다면,
pip install bs4
를 통해 설치를 해줘야한다.
https://www.pythonscraping.com/pages/warandpeace.html
위 홈페이지에 있는 HTML이다.
from bs4 import BeautifulSoup
from urllib.request import urlopen
만약 찾는 태그가 여러개라면 제일 처음 나오는 태그만 가져옴.
빨간 글자를 다 가져와보겠다.
print(bs.find('span'))
모든 span 태그를 다 찾는 방법
bs.find_all('span')
보다시피 [ ] 로 감싸져있다. 즉, List로 받아왔다.
spanTagList = bs.find_all('span', class_='green')
for spanTag in spanTagList :
print(spanTag.get_text())
class가 green으로 되어있는것을 변수로 주고, for문으로 돌려줬다.
728x90
반응형
'✨ python > 크롤링(Crawling)' 카테고리의 다른 글
파이썬(python) - 웹크롤링, Selenium (0) | 2023.05.15 |
---|---|
파이썬(python) - 네이버 뉴스 제목 가져오기 (크롤링) (0) | 2023.05.12 |
파이썬(python) - 크롤링(Crawling) 또는 스크래핑(Scraping) - 2 (0) | 2023.05.11 |
댓글