BeautifulSoup


response自体はBeauitfulSoup自体を経由するコンテンツ自体と同じです.
import requests
from bs4 import BeautifulSoup
url="http://www.daum.net"
response=requests.get(url)
print(type(response.text))
print(type(BeautifulSoup(response.text,'html.parser')))
結果

このことから,内容物自体は同じであるが,タイプが異なることがわかる.
file=open("naver.html","w",encoding="utf-8")
file.write(response.text)
file.close()

仕事中にhtmlファイルが破壊されたことを発見しました.その前に.
file=open("naver.html","w")
満杯になると、符号化が正しくなく文字が割れているように見えるので、encoding=「utf-8」が追加されました.htmlがこのように表示されると、Googleでソート用のショートカットキーを検索すると、ctrl+aなどの任意の数のブロックが表示され、ctrl+k、ctrl+pを押してソートされます.
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = "https://datalab.naver.com/keyword/realtimeList.naver?age=20s"
response = requests.get(url,headers=headers)
上のコードはロボット(?)これは違うコードを証明するためです.これらの情報がヘッダファイルに含まれて要求されると、値が正しいかどうかを判断できます.