파이썬 웹 크롤링(Web Crawler)

a 태그 안에 href 이미지 긁어오기

BeautifulSoup을 이용한 웹 긁어오기

from urllib.request import *
from bs4 import BeautifulSoup

http = "URL"

html = urlopen(http + "images")
soup = BeautifulSoup(html, "html.parser")

link_temp = ""
image_local_name = ""

for link in soup.findAll('a'):
    if 'href' in link.attrs:
        link_temp = link.attrs['href']
        try:
            image_local_name = link_temp.split('.')[0]
            urlretrieve(http + link_temp, link.get('href'))
        except:
            continue

저작자표시 비영리

'[ ★ ]Study > Programming' 카테고리의 다른 글

Python TypeError : 파이썬 타입에러 (0)	2020.09.18
파이썬 mysql 로그 삽입 (0)	2020.08.25
gcc make : Nothing to be done for 'all' Error (0)	2020.07.13
GetAsyncKeyState 함수와 GetKeyState 함수의 차이 (0)	2020.03.13
PROCESSENTRY32 구조체 (0)	2020.03.06

nroses-taek

파이썬 웹 크롤링(Web Crawler)

'[ ★ ]Study > Programming' 카테고리의 다른 글

댓글

티스토리툴바

파이썬 웹 크롤링(Web Crawler)

'[ ★ ]Study > Programming' 카테고리의 다른 글

관련글

댓글

티스토리툴바