PyhonのスクレイピングでTorを使用してChromeにアクセスする


Pyhonのスクレイピングを勉強中です。今回はTorを使用して、Chromeにアクセスする方法をメモします。なお、Torを使用して何かやらかしても、この記事とぼく個人の一切の責任をおいません。

Seleniumをインストール

seleniumをpipでインストール
Selenium公式サイト: https://pypi.org/project/selenium/

$ pip install selenium

seleniumとセットで使用するosライブラリは、Pythonをインストールしたらデフォルトで入っているみたいなので、割愛します。
osライブラリの参考: https://www.lifewithpython.com/2013/03/os-module.html

ソース

tor_accessor.py
import os
from selenium import webdriver

# オプションでPROXYを設定
PROXY = "socks5://localhost:9050"
options = webdriver.ChromeOptions()
options.add_argument("start-maximized")
options.add_argument("disable-infobars")
options.add_argument("--disable-extensions")
options.add_argument('--proxy-server=%s' % PROXY)
driver = webdriver.Chrome(chrome_options=options, executable_path="/usr/local/bin/chromedriver")

# Torが設定されているかを確認するサイトを開く
driver.get("http://check.torproject.org")

実行

$ python tor_accessor.py

ちゃんとTorを介したら、この画面になる

Congratulations. This browser is configured to use Tor.

Google翻訳: おめでとう。このブラウザーはTorを使用するように構成されています。


Torを介してないと、この画面のように玉ねぎにバッテンがつく

Sorry. You are not using Tor.

ごめんなさい。あなたはTorを使っていません。

関連記事
【Pyhon】Torを使用してスクレイピングする

参考
https://www.366service.com/jp/qa/81b67eb666ad284089fd2ea7e04d6f3d

Torを介しているかチェックするサイト
http://check.torproject.org