松江画像Web scripping(スクロール)
Pythonパッケージ、ライブラリ
このパッケージのバンドルをライブラリと呼びます.
仮想環境(仮想環境)
アイテム固有のツールボックスと見なします.
パッケージをツールボックスに入れて管理しやすい
ex.ツールボックス1にa,b,c/ツールボックス2にb,c,dを加える
Python用語集
dlloadライブラリ
dload
は、URLからファイルをダウンロードするパッケージです.このパッケージで画像をダウンロードできます.file->settings->Pythonインタプリタ->dlload検索->install
使用方法🎯
import dload
dload.save("https://spartacodingclub.kr/static/css/images/ogimage.png")
画像Web scraping(スクロール)
Web scripting(Web scripting)は、Webページから私たちが望んでいるデータの一部を収集する(韓国では、同じ操作もスクロールキャプチャに混用されている).
ウェブブラウズを行うためには,特定のウェブページを構成するHTML情報を受信する必要がある.ここでは、Pythonを直接使用してChromeブラウザを制御してWebページを表示したりHTMLを読み取ったりする方法を採用しています.
selenium
パッケージを使用して、ブラウザを制御します.(例えばdload
)Seleniumを使用するには、
웹드라이버
というファイルも必要です.(Chromeでマイバージョンを検証してインストール)▶Webドライバのインストールリンク
selenium
開始コード🎯from selenium import webdriver
driver = webdriver.Chrome('chromedriver')
driver.get("http://www.naver.com")
beautifulsoup4
)プロジェクト解釈器で
bs4
を検索してダウンロードするselect/select oneの使い方を理解しなければなりません!
beautifulsoup
のselectを使用🎯# 선택자를 사용하는 방법 (copy selector)
soup.select('태그명')
soup.select('.클래스명')
soup.select('#아이디명')
soup.select('상위태그명 > 하위태그명 > 하위태그명')
soup.select('상위태그명.클래스명 > 하위태그명.클래스명')
# 태그와 속성값으로 찾는 방법
soup.select('태그명[속성="값"]')
# 한 개만 가져오고 싶은 경우
soup.select_one('위와 동일')
ファイナルエンコーディング
import dload
from bs4 import BeautifulSoup
from selenium import webdriver
import time
driver = webdriver.Chrome('chromedriver') # 웹드라이버 파일의 경로
driver.get("https://search.daum.net/search?nil_suggest=btn&w=img&DA=SBC&q=%EC%86%A1%EA%B0%95") #송강
time.sleep(3) # 3초 동안 페이지 로딩 기다리기
req = driver.page_source
soup = BeautifulSoup(req, 'html.parser')
thumbnails = soup.select('#imgList > div > a > img')
#select는 리스트기 때문에 for문 돌리면 하나한 접근가능!
i = 0
for thumbnail in thumbnails:
img = thumbnail['src']
dload.save(img,f'img/{i}.jpg')
i += 1
driver.quit() # 끝나면 닫아주기
結果imgファイルに宋江が見えます!
スパルタエンコーディングクラブの48時間エンコーディングタスク(無料講座)をしています.
有益で面白い.一人でコードを勉強している人は一度聞いてみます.
おなじみをお勧めします!
注)スパルタコード-Pythonひとり遊び注釈📖
Reference
この問題について(松江画像Web scripping(スクロール)), 我々は、より多くの情報をここで見つけました https://velog.io/@choi46910/송강-이미지-웹스크래핑크롤링テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol