python 3爬虫類学習(一)

1691 ワード

サインしたばかりで暇だったので、断続的に爬虫類を少し勉強したことがありますが、もう一度勉強したいと思っています.今回は頑張って、よく勉強してほしいです.爬虫類--その名の通り、ネットワークシステム全体でクモのように、爬虫類は、ノードに着くたびに、そのノードのデータを記録し、アクセスしたかどうかを記録します.ノードとは、ネットワークでよく言われるサイトです.爬虫類全体のプロセスは,広さ優先探索(BFS)ネットワークに似ている.
コード実装(一)
#encoding:UTF-8
import urllib.request
import urllib

data={}
data['wd']='  ' #    'word'
url = "http://www.baidu.com/s?"
url_values=urllib.parse.urlencode(data) // data  url   ,            
full_url=url+url_values

data = urllib.request.urlopen(full_url).read() //      ,           
data = data.decode('UTF-8') //            'UTF-8'
print(data)