반응형
혼자 공부하는 데이터 분석 p.124
웹 스크레핑
import requests
from bs4 import BeautifulSoup
def get_page_cnt(isbn):
url = 'http://www.yes24.com/product/search?domain=BOOK&query={}'
r = requests.get(url.format(isbn))
soup = BeautifulSoup(r.text, 'html.parser')
prd_info = soup.find('a',attrs = {'class':'gd_name'})
url = 'http://www.yes24.com' + prd_info['href']
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
prd_detail = soup.find('div', attrs = {'id':'infoset_specific'})
prd_tr_list = prd_detail.find_all('tr')
for tr in prd_tr_list:
if tr.find('th').get_text() == '쪽수, 무게, 크기':
return tr.find('td').get_text().split()[0]
return ''
get_page_cnt(9791190090018)
반응형
'코딩 > Python' 카테고리의 다른 글
[파이썬] 혼자 공부하는 데이터 분석(06 데이터표현, 07 검증,예측) (0) | 2023.04.30 |
---|---|
[파이썬] 혼자 공부하는 데이터 분석(03-2 잘못된 데이터 수정하기) (0) | 2023.04.25 |
머신러닝 알고리즘 익히기(Logistic Regression, Random Forest, Gradient Boosting, Light GBM), (0) | 2023.04.18 |
파이썬, openpyxl(6) 수식작성, 병합, 이미지삽입 (0) | 2023.03.31 |
[Python] 백준 6603 로또 (0) | 2022.12.29 |