웹스크래핑 더 해보기 (순위, 제목, 별점) Q. 아래와 같이 보이면 완성! A. 완성 코드 import requests from bs4 import BeautifulSoup # URL을 읽어서 HTML를 받아오고, headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers) # HTML을 BeautifulSoup이라..
크롤링 : 구글, 네이버의 검색엔진이 내 사이트를 퍼가는 것 (=스크립) 크롤링이 가능한 이유 : 내가 이미 받아온 걸 구별하는 것 1. 요청하는 거(코드 따는거) 2. html에서 내가 원하는 정보를 잘 구별하는 것 항상 기본 코드를 붙여놓고 시작!! import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie...
어떤 걸 스크래핑 할 계획인가요? [코드스니펫] 네이버영화페이지 https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303 랭킹 : 네이버 영화 영화, 영화인, 예매, 박스오피스 랭킹 정보 제공 movie.naver.com 패키지 추가 설치하기(beautifulsoup4) bs4 크롤링 기본 세팅 [코드스니펫] 크롤링 기본 세팅 import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 S..
Requests 라이브러리 사용해보기 + List/Dictionary/함수/If/For문 연습 아래 방법으로 서울시 대기 OpenAPI에서, 중구의 NO2 값을 가져올 수 있습니다. [코드스니펫] requests 써보기 import requests # requests 라이브러리 설치 필요 r = requests.get('http://openapi.seoul.go.kr:8088/6d4d776b466c656533356a4b4b5872/json/RealtimeCityAir/1/99') rjson = r.json() print(rjson['RealtimeCityAir']['row'][0]['NO2']) 모든 구의 IDEX_MVL 값을 찍어주자! import requests # requests 라이브러리 설치 필..