Pythonでスクレイピング


BeautifulSoupの準備はこちら

最近モチベーション上がらなくて、上げるためにとりあえず書くことにしました。
本当に基礎の基礎なので悪しからず

とりあえず、BeautifulSoupを実行してみます。

from urllib.request import urlopen
from bs4 import BeautifulSoup

# 取得するページ
html = urlopen('http://www.pythonscraping.com/pages/page1.html')
bs = BeautifulSoup(html.read(), 'html.parser')
# h1タグを返す
print(bs.h1)

2行目の

from bs4 import BeautifulSoup

部分でBeautifulSoupをインポートする。
実行結果は下記となる。

http://www.pythonscraping.com/pages/page1.html
上記ページのh1タグだけ取得できることがわかる。

次回はちゃんとした内容で投稿します。

参考文献

PythonによるWebスクレイピング(オライリー・ジャパン)