웹스크래핑(교보문고 ISBN으로 쪽수 가져오기)

혼자 공부하는 데이터 분석 p.124

웹 스크레핑

import requests
from bs4 import BeautifulSoup

def get_page_cnt(isbn):
  url = 'http://www.yes24.com/product/search?domain=BOOK&query={}'
  r = requests.get(url.format(isbn))
  soup = BeautifulSoup(r.text, 'html.parser')
  prd_info = soup.find('a',attrs = {'class':'gd_name'})
  url = 'http://www.yes24.com' +  prd_info['href']
  r = requests.get(url)
  soup = BeautifulSoup(r.text, 'html.parser')
  prd_detail = soup.find('div', attrs = {'id':'infoset_specific'}) 
  prd_tr_list = prd_detail.find_all('tr')
  for tr in prd_tr_list:
   if tr.find('th').get_text() == '쪽수, 무게, 크기':
     return tr.find('td').get_text().split()[0]
  return ''   
get_page_cnt(9791190090018)

저작자표시

'코딩 > Python' 카테고리의 다른 글

[파이썬] 혼자 공부하는 데이터 분석(06 데이터표현, 07 검증,예측) (0)	2023.04.30
[파이썬] 혼자 공부하는 데이터 분석(03-2 잘못된 데이터 수정하기) (0)	2023.04.25
머신러닝 알고리즘 익히기(Logistic Regression, Random Forest, Gradient Boosting, Light GBM), (0)	2023.04.18
파이썬, openpyxl(6) 수식작성, 병합, 이미지삽입 (0)	2023.03.31
[Python] 백준 6603 로또 (0)	2022.12.29

자본왕김민춘의 블로그

웹스크래핑(교보문고 ISBN으로 쪽수 가져오기)

'코딩 > Python' 카테고리의 다른 글

티스토리툴바

웹스크래핑(교보문고 ISBN으로 쪽수 가져오기)

'코딩 > Python' 카테고리의 다른 글

'코딩/Python' Related Articles

티스토리툴바