爬虫類の過程の中で出会うURLErrorとHTTPError,およびそれらに対する処理

1091 ワード

**
一、URLError
**1、URLErrorが発生した原因は主に、ネットワーク接続がない、サーバ接続が失敗した、指定されたサーバが見つからない2、requestsにおける異常は、requests.Exceptions異常は何ですか:requests.exceptions.ConnectionError未知のサーバrequests.exceptions.接続接続読み出しタイムアウトrequests.exceptions.ProxyErrorエージェントが接続されていません
try except文を使用して、対応する例外をキャプチャできます.次の例では、存在しないドメイン名にアクセスします.
import requests
try:
	response = requests.get(url="http://www.lalalala.com")
	print("   url",url)
except request.exceptions.ConnectionError as e :
	print("ConnectionError:
",e) except Exception as e: print(e)

上記のコードには11004のエラー番号が表示されます.エラーの原因は、有効なウェブサイトサーバアドレスtryを取得できなかったことです.プログラムの頑丈性を保証する.2.問題のあるデータを収集し、痕を残す作業を行う.
二、HTTPError
HTTPErrorはURLErrorのサブクラスであり、要求を発行すると、サーバにはresponse応答オブジェクトが対応し、デジタル「応答ステータスコード」が含まれています.urlopenまたはopenerの場合.Openが処理できない場合、対応するステータスコードに対応するHTTPErrorが生成され、HTTPステータスコードはHTTPプロトコルが返す応答の状態を表す.注意、urllibはリダイレクトされたページ(つまり3の先頭の応答コード)を処理することができ、100-299の範囲の番号は成功を示すので、400-599のエラー番号しか見えません.HTTPErrorの親はURLErrorなので、親の異常は子の異常の後に書くべきです.つまり、まず、子の異常をキャプチャします.子クラスがキャプチャされない場合は、親クラスの例外をキャプチャできます.