松江画像Web scripping(スクロール)


Pythonパッケージ、ライブラリ

  • Pythonでモジュールをカプセル化するユニット
    このパッケージのバンドルをライブラリと呼びます.
  • 仮想環境(仮想環境)

  • venv-仮想環境の作成
    アイテム固有のツールボックスと見なします.
    パッケージをツールボックスに入れて管理しやすい
    ex.ツールボックス1にa,b,c/ツールボックス2にb,c,dを加える
    Python用語集
  • dlloadライブラリ

  • dloadは、URLからファイルをダウンロードするパッケージです.このパッケージで画像をダウンロードできます.

  • file->settings->Pythonインタプリタ->dlload検索->install

  • 使用方法🎯
    import dload
    
    dload.save("https://spartacodingclub.kr/static/css/images/ogimage.png")

    画像Web scraping(スクロール)


  • Web scripting(Web scripting)は、Webページから私たちが望んでいるデータの一部を収集する(韓国では、同じ操作もスクロールキャプチャに混用されている).

  • ウェブブラウズを行うためには,特定のウェブページを構成するHTML情報を受信する必要がある.ここでは、Pythonを直接使用してChromeブラウザを制御してWebページを表示したりHTMLを読み取ったりする方法を採用しています.
  • seleniumパッケージを使用して、ブラウザを制御します.(例えばdload)
    Seleniumを使用するには、웹드라이버というファイルも必要です.
    (Chromeでマイバージョンを検証してインストール)▶Webドライバのインストールリンク
  • selenium開始コード🎯
    from selenium import webdriver
    driver = webdriver.Chrome('chromedriver')
    
    driver.get("http://www.naver.com")
  • パッケージの追加(beautifulsoup4)
    プロジェクト解釈器でbs4を検索してダウンロードする
    select/select oneの使い方を理解しなければなりません!
  • beautifulsoupのselectを使用🎯
    # 선택자를 사용하는 방법 (copy selector)
    soup.select('태그명')
    soup.select('.클래스명')
    soup.select('#아이디명')
    
    soup.select('상위태그명 > 하위태그명 > 하위태그명')
    soup.select('상위태그명.클래스명 > 하위태그명.클래스명')
    
    # 태그와 속성값으로 찾는 방법
    soup.select('태그명[속성="값"]')
    
    # 한 개만 가져오고 싶은 경우
    soup.select_one('위와 동일')
    ファイナルエンコーディング
    
    import dload
    from bs4 import BeautifulSoup
    from selenium import webdriver
    import time
    
    driver = webdriver.Chrome('chromedriver') # 웹드라이버 파일의 경로
    driver.get("https://search.daum.net/search?nil_suggest=btn&w=img&DA=SBC&q=%EC%86%A1%EA%B0%95") #송강
    
    time.sleep(3) # 3초 동안 페이지 로딩 기다리기
    
    req = driver.page_source
    
    soup = BeautifulSoup(req, 'html.parser')
    
    thumbnails = soup.select('#imgList > div > a > img') 
    #select는 리스트기 때문에 for문 돌리면 하나한 접근가능!
    
    i = 0
    for thumbnail in thumbnails:
        img = thumbnail['src']
        dload.save(img,f'img/{i}.jpg')
        i +=  1
    driver.quit() # 끝나면 닫아주기
    
    結果
    imgファイルに宋江が見えます!

    スパルタエンコーディングクラブの48時間エンコーディングタスク(無料講座)をしています.
    有益で面白い.一人でコードを勉強している人は一度聞いてみます.
    おなじみをお勧めします!
    注)スパルタコード-Pythonひとり遊び注釈📖