DB 설치 확인 먼저, 각자 설치해온 DB가 잘 작동하는지 확인합니다. 크롬 창에 localhost:27017 이라고 쳤을 때, 아래와 같은 화면이 나오면 mongoDB가 돌아가고 있는 것입니다. robo 3T 준비하기 robo 3T의 역할 mongoDB라는 프로그램은 참 특이한 친구예요. 눈으로 보이지 않는답니다. 유식한 말로, 그래픽인터페이스(=GUI)를 제공하지 않는다고 표현합니다. 데이터를 저장했는데 눈으로 보이진 않고.. 답답하겠죠? 그래서 DB내부를 살펴보기 위한 프로그램을 따로 설치해야해요. → 이것이 바로 robo3T의 역할! 참고) 우리 눈에는 안보이지만(=GUI는 없지만) 컴퓨터에서 돌아가는 프로그램들은 무척 많으니, 너무 놀라지 마세요~! robo3T 세팅하기. 아래처럼 준비해서 ro..
웹스크래핑 더 해보기 (순위, 제목, 별점) Q. 아래와 같이 보이면 완성! A. 완성 코드 import requests from bs4 import BeautifulSoup # URL을 읽어서 HTML를 받아오고, headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers) # HTML을 BeautifulSoup이라..
크롤링 : 구글, 네이버의 검색엔진이 내 사이트를 퍼가는 것 (=스크립) 크롤링이 가능한 이유 : 내가 이미 받아온 걸 구별하는 것 1. 요청하는 거(코드 따는거) 2. html에서 내가 원하는 정보를 잘 구별하는 것 항상 기본 코드를 붙여놓고 시작!! import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie...
어떤 걸 스크래핑 할 계획인가요? [코드스니펫] 네이버영화페이지 https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303 랭킹 : 네이버 영화 영화, 영화인, 예매, 박스오피스 랭킹 정보 제공 movie.naver.com 패키지 추가 설치하기(beautifulsoup4) bs4 크롤링 기본 세팅 [코드스니펫] 크롤링 기본 세팅 import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 S..