[python] #0. Webスクロール機能の開発開始
Webスクロール準備
pip install bs4
pip install requests
必要なライブラリimport
import requests
from bs4 import BeautifulSoup
要求によるURLの接続
req = requests.get("https://finance.naver.com/item/main.naver?code=035720");
接続されたWebサイトのコンテンツの取得
soup = BeautifulSoup(req.content, 'html.parser')
要素を選ぶことが大切です
まず、開発者ツールを使用して、何を選択するかを決定します.
コレクタの作成(これは非常に重要です)
text1 = soup.select("#_market_sum")[0].text;
公式文書のコレクター部分を参考にすればいいです.
https://www.crummy.com/software/BeautifulSoup/bs4/doc/
ハングルファイルも
https://www.crummy.com/software/BeautifulSoup/bs4/doc.ko/
確認(ハングルが目立つように見えるので確認が必要…)
ソース全体がこんな感じ
#-*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
req = requests.get("https://finance.naver.com/item/main.naver?code=035720");
soup = BeautifulSoup(req.content, 'html.parser')
text1 = soup.select("#_market_sum")[0].text;
print(text1)
1回目の接触スクロール
確かに魅力的な機能です.興味深いことに、直接サイトにアクセスしなくても、URLや特定の要素のコレクターでしかコンテンツを取得できません.しかし、スクロールしすぎると接続が中断するので、乱発しないでください.の最後の部分
Reference
この問題について([python] #0. Webスクロール機能の開発開始), 我々は、より多くの情報をここで見つけました https://velog.io/@exoluse/python-1.-간단하게-웹-크롤링-기능-개발テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol