python爬虫類は、最も簡単な方法だと思っています.
3057 ワード
Pythonはやはり簡単で、個人的には爬虫類が本当に面白いと思います.簡単な数行のコードで、1つのページに登ることができて、本当に不思議で面白いです.もちろん、爬虫類は良いですが、操作するには考慮する必要があります.htmlファイルを読むことができれば、正規表現を考えてマッチングすることができます.今回は前回の簡単なコードについて.
#
import requests
from bs4 import BeautifulSoup
#
try:
# url
url = 'https://www.bilibili.com/v/music'
# requests.get(url)
res = requests.get(url, timeout=30)
# raise_for_status() 200
res.raise_for_status()
# apparent_encoding = 'utd-8'
res.encoding = res.apparent_encoding
# BeautifulSoup() html
soup = BeautifulSoup(res.text, 'html.parser')
for i in soup.find_all('a'):
# a
print(i.attrs['href']+"\t"+i.text)
except:
print(' ')
"""
,
"""