[python] #0. Webスクロール機能の開発開始


Webスクロール準備

  • BeautifulSoupインストール
  • pip install bs4
  • インストール要求
  • pip install requests

    必要なライブラリimport

    import requests
    from bs4 import BeautifulSoup

    要求によるURLの接続

    req = requests.get("https://finance.naver.com/item/main.naver?code=035720");

    接続されたWebサイトのコンテンツの取得

    soup = BeautifulSoup(req.content, 'html.parser')

    要素を選ぶことが大切です


  • まず、開発者ツールを使用して、何を選択するかを決定します.


  • コレクタの作成(これは非常に重要です)
  • text1 = soup.select("#_market_sum")[0].text;

  • 公式文書のコレクター部分を参考にすればいいです.
    https://www.crummy.com/software/BeautifulSoup/bs4/doc/

  • ハングルファイルも
    https://www.crummy.com/software/BeautifulSoup/bs4/doc.ko/

  • 確認(ハングルが目立つように見えるので確認が必要…)

  • ソース全体がこんな感じ

    #-*- coding:utf-8 -*-
    import requests
    from bs4 import BeautifulSoup
    
    
    req = requests.get("https://finance.naver.com/item/main.naver?code=035720");
    soup = BeautifulSoup(req.content, 'html.parser')
    text1 = soup.select("#_market_sum")[0].text;
    
    print(text1)

    1回目の接触スクロール


    確かに魅力的な機能です.興味深いことに、直接サイトにアクセスしなくても、URLや特定の要素のコレクターでしかコンテンツを取得できません.しかし、スクロールしすぎると接続が中断するので、乱発しないでください.の最後の部分