본문 바로가기

✨ python16

파이썬(python) - 네이버 뉴스 제목 가져오기 (크롤링) https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=105 IT/과학 : 네이버 뉴스 모바일, 인터넷, SNS, 통신 등 IT/과학 분야 뉴스 제공 news.naver.com 나는 이 네이버 뉴스에서 헤드라인 뉴스를 가지고 오려고 한다. F12를 눌러 태그가 어디에 싸여져 있는지 알아봤는데, a태그의 sh_text_headline 에 쌓여져 있는걸 확인할 수 있다. a태그만 조회해봤는데, 양이 엄청났다. a태그의 텍스트만 조회했는데도 여전히 많다. 이렇게 a에 포함된 클래스를 함께 주기 위해서는 class_ 를 사용할 수 있다. HTML 삽입 미리보기할 수 없는 소스 위에서부터 천천히 살펴보자. 1. 헤드라인 뉴스와 나머지 뉴스를 모두 포함한 Di.. 2023. 5. 12.
파이썬(python) - 크롤링(Crawling) 또는 스크래핑(Scraping) - 2 http://books.toscrape.com/catalogue/category/books/travel_2/index.html Travel | Books to Scrape - Sandbox £56.88 In stock books.toscrape.com 해당 페이지의 책 제목들을 들고와보자. a태그 위의 h3태그로 감싸져있는 것을 볼 수 있다. HTML 삽입 미리보기할 수 없는 소스 이러면 끝난다.. find_all 을하면 List의 형태로 태그들을 가지고 와준다. 따라서 이렇게 for 문에서 반복시켜주면서 한줄 한줄 데이터를 뽑을 수 있다. 2023. 5. 11.
파이썬(python) - 크롤링(Crawling) 또는 스크래핑(Scraping) 먼저, 파이썬에서 크롤링을 처음한다면, pip install bs4 를 통해 설치를 해줘야한다. https://www.pythonscraping.com/pages/warandpeace.html 2023. 5. 11.
파이썬(python) - 딕셔너리(Dictionary) 이번에는 데이터의 사전이라고도 불리는 딕셔너리에 대해서 알아보았다. 키: 값 쌍으로 구성되는 json과 비슷한 형태이며 데이터 사전에 데이터들을 저장해 놨다가 필요할 때마다 값들을 불러와 사용할 수 있는 방식이다. { 'name' : ['홍길동', '이순신'], 'age' : [40,50], 'score' : [80, 90] } 이와 같은 데이터를 갖는 딕셔너리를 만드는데 모든 키와 값은 키보드로 입력받아 생성. . 이름, 나이, 국어점수, 영어점수를 데이터로 갖는 student 딕셔너리를 만드시오. 각 데이터는 키보드로 입력받아 저장하고, 저장된 데이터를 출력하시오 위 문제에서 만든 딕셔너리 데이터에 총점 데이터를 추가하시오. 총점 데이터는 국어,영어 점수의 합으로 들어가야합니다. 2023. 5. 8.