[python] #0. Webスクロール機能の開発開始

1896 ワード

Webスクロール準備

BeautifulSoupインストール

pip install bs4

インストール要求

pip install requests

必要なライブラリimport

import requests
from bs4 import BeautifulSoup

要求によるURLの接続

req = requests.get("https://finance.naver.com/item/main.naver?code=035720");

接続されたWebサイトのコンテンツの取得

soup = BeautifulSoup(req.content, 'html.parser')

要素を選ぶことが大切です

まず、開発者ツールを使用して、何を選択するかを決定します.

コレクタの作成(これは非常に重要です)

text1 = soup.select("#_market_sum")[0].text;

公式文書のコレクター部分を参考にすればいいです.
https://www.crummy.com/software/BeautifulSoup/bs4/doc/

ハングルファイルも
https://www.crummy.com/software/BeautifulSoup/bs4/doc.ko/

確認(ハングルが目立つように見えるので確認が必要…)

ソース全体がこんな感じ

#-*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup


req = requests.get("https://finance.naver.com/item/main.naver?code=035720");
soup = BeautifulSoup(req.content, 'html.parser')
text1 = soup.select("#_market_sum")[0].text;

print(text1)

1回目の接触スクロール

確かに魅力的な機能です.興味深いことに、直接サイトにアクセスしなくても、URLや特定の要素のコレクターでしかコンテンツを取得できません.しかし、スクロールしすぎると接続が中断するので、乱発しないでください.の最後の部分

Reference

この問題について([python] #0. Webスクロール機能の開発開始), 我々は、より多くの情報をここで見つけました https://velog.io/@exoluse/python-1.-간단하게-웹-크롤링-기능-개발

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

SQL

CSSスタイルの書式設定