BeautifulSoup
-
BeautifulSoup로 웹 크롤링 하기💻 프로그래밍/Python 2017. 10. 29. 22:08
안녕하세요!! JAY입니다. 오늘은 파이썬으로 웹 크롤링을 해보도록 하겠습니다. 오늘 웹 크롤링을 하기 위해 BeautifulSoup 라는 API를 사용할 것 입니다. BeautifulSoup는 HTML과 XML 파일로부터 데이터를 뽑아내기 위한 파이썬 라이브러리입니다. BeautifulSoup 문서 : https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 1. BeutifulSoup 설치 먼저 pip install beautifulsoup4 명령어로 BeautifulSoup를 설치해 줍니다. 추가로 우리는 URL을 가지고 크롤링을 해야하기 때문에 urlib패키지의 request모듈을 사용하겠습니다. 2. URL 읽어오기 123# -*- coding:UTF-8..