python BeautifulSoup 설치 및 사용법
작성자 정보
- 마스터 작성
- 작성일
컨텐츠 정보
- 228 조회
- 목록
본문
0. BeautifulSoup란?
html의 데이터를 추출해주는 라이브러리입니다.
사이트의 html 데이터를 가져오기 위해 requests 가 필요하기도 합니다.
1. BeautifulSoup 설치하기
pip install beautifulsoup4 pip install requests
2. BeautifulSoup 사용법
import requests
from bs4 import BeautifulSoup
url = 'https://www.naver.com'
response = requests.get(url)
if response.status_code == 200:
html = response.text
soup = BeautifulSoup(html, 'html.parser')
print(soup)
else :
print(response.status_code)
#필요한 라이브러리 import 하기 (라이브러리가 없으면 설치를 해야 합니다)
import requests
from bs4 import BeautifulSoup
#데이터를 가져올 url을 변수로 담아 설정하고 requests.get(url)로 데이터를 받아옵니다.
url = 'https://www.naver.com'
response = requests.get(url)
#응답받은 url의 html의 text를 가져와 변수에 담는다.
#BeautifulSoup()를 사용하여 데이터를 soup로 바꾼다.
html = response.text
soup = BeautifulSoup(html, 'html.parser')
3. soup 사용법
[3-1 . 사용] 점( . )을 사용해서 태그의 첫번째 데이터에 접근이 가능합니다,.
soup.a / soup.title / soup.div
[3-2 find() 사용] soup.find()를 사용하여 해당하는 속성의 첫번째의 데이터에 접근이 가능합니다.
soup.find('a', attrs={"class": "Nbtn_upload"}))
[3-3 find_all() 사용] soup.find_all()을 사용하여 해당하는 속성의 전체 데이터에 접근이 가능합니다.
soup.find_all('td', attrs={"class": "title"})
관련자료
-
이전
-
다음