Python爬虫類庫requestsを使って要求を送信し、URLパラメータを伝達し、headersをカスタマイズします。


まず、私達は先にrequestsモジュールを導入します。

import requests
一、請求を送信する

r = requests.get('https://api.github.com/events') # GET  
r = requests.post('http://httpbin.org/post', data = {'key':'value'}) # POST  
r = requests.put('http://httpbin.org/put', data = {'key':'value'}) # PUT  
r = requests.delete('http://httpbin.org/delete') # DELETE  
r = requests.head('http://httpbin.org/get') # HEAD  
r = requests.options('http://httpbin.org/get') # OPTIONS  
type(r)

requests.models.Response
二、転送URLパラメータ
URL転送パラメータの形式は、httpbin.org/get?key=valです。しかし、手動の構造は面倒くさいです。これはパラmsパラメータを使用して便利な構造帯域パラメータURLです。

payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.get("http://httpbin.org/get", params=payload)
print(r.url)

http://httpbin.org/get?key1=value1&key2=value2
同じkeyで複数のvalueがあります。

payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
r = requests.get('http://httpbin.org/get', params=payload)
print(r.url)

http://httpbin.org/get?key1=value1&key2=value2&key2=value3
三、カスタムheaders
一つのdictをheadersパラメータに渡すだけでheadersをカスタマイズできます。

url = 'https://api.github.com/some/endpoint'
headers = {'user-agent': 'my-app/0.0.1'}
r = requests.get(url, headers=headers)
Python爬虫類庫requestsの使い方については、以下の関連リンクをクリックしてください。