python

python BeautifulSoup 설치 및 사용법

작성자 정보

  • 마스터 작성
  • 작성일

컨텐츠 정보

본문

 0. BeautifulSoup란?

 html의 데이터를 추출해주는 라이브러리입니다. 

 사이트의 html 데이터를 가져오기 위해 requests 가 필요하기도 합니다.

 

 

 1. BeautifulSoup 설치하기 

pip install beautifulsoup4 pip install requests

 


 2. BeautifulSoup 사용법

import requests

from bs4 import BeautifulSoup


url = 'https://www.naver.com'


response = requests.get(url)


if response.status_code == 200:

    html = response.text

    soup = BeautifulSoup(html, 'html.parser')

    print(soup)


else : 

    print(response.status_code)

#필요한 라이브러리 import 하기 (라이브러리가 없으면 설치를 해야 합니다)

import requests 

from bs4 import BeautifulSoup

 

 

#데이터를 가져올 url을 변수로 담아 설정하고 requests.get(url)로 데이터를 받아옵니다.

url = 'https://www.naver.com'

response = requests.get(url) 

 

#응답받은 url의 html의 text를 가져와 변수에 담는다.

#BeautifulSoup()를 사용하여 데이터를 soup로 바꾼다.

html = response.text

soup = BeautifulSoup(html, 'html.parser')

 

 

3. soup 사용법

[3-1  .  사용] 점( . )을 사용해서 태그의 첫번째 데이터에 접근이 가능합니다,.

soup.a  /  soup.title /  soup.div 

 

[3-2 find() 사용] soup.find()를 사용하여 해당하는 속성의 첫번째의 데이터에 접근이 가능합니다.

soup.find('a', attrs={"class": "Nbtn_upload"})) 

 

[3-3 find_all() 사용]  soup.find_all()을 사용하여 해당하는 속성의 전체 데이터에 접근이 가능합니다. 

soup.find_all('td', attrs={"class": "title"})

관련자료

댓글 0
등록된 댓글이 없습니다.

최근글


새댓글


알림 0