python爬虫類は、最も簡単な方法だと思っています.

3057 ワード

Pythonはやはり簡単で、個人的には爬虫類が本当に面白いと思います.簡単な数行のコードで、1つのページに登ることができて、本当に不思議で面白いです.もちろん、爬虫類は良いですが、操作するには考慮する必要があります.htmlファイルを読むことができれば、正規表現を考えてマッチングすることができます.今回は前回の簡単なコードについて.
#       
import requests
from bs4 import BeautifulSoup
#               
try:
    # url          
    url = 'https://www.bilibili.com/v/music'
    #  requests.get(url)       
    res = requests.get(url, timeout=30)
    # raise_for_status()    200      
    res.raise_for_status()
    # apparent_encoding = 'utd-8'
    res.encoding = res.apparent_encoding
    #  BeautifulSoup()  html
    soup = BeautifulSoup(res.text, 'html.parser')
    for i in soup.find_all('a'):
        #   a       
        print(i.attrs['href']+"\t"+i.text)
except:
    print('  ')
    """
             ,        
    """