seleniumを使用して自動的に登りたい内容を抽出します

3410 ワード

1、seleniumのインストール
CMDでpip install seleniumを入力すればいいです(ダウンロードソースを指定できます.詳細はこのリンクをクリックしてください)https://blog.csdn.net/weixin_44548394/article/details/882254652、Googleブラウザドライバchromedriver(火狐などの他のブラウザを使用することもできます)をダウンロードし、使用してウェブサイトをダウンロードします.http://chromedriver.storage.googleapis.com/index.html注意:ダウンロードする前に、Googleブラウザのバージョン在这里插入图片描述を確認して、選択したボタンをクリックしてください.Google Chrome 使用selenium自动爬取想要爬取的内容_第1张图片についてGoogleブラウザドライバをダウンロードして、あなたのブラウザバージョンに最も近いバージョンを選択します.例えば、私のバージョンは71.0.3578.98です.では、私のブラウザバージョンに最も近いバージョン使用selenium自动爬取想要爬取的内容_第2张图片を選択して、ダウンロードしたファイルをブラウザのフォルダに解圧します.(ブラウザを選択し、右クリックしてフォルダを開く場所を選択して、それを入れます)
次に、環境変数を設定してこのコンピュータを選択する必要があります.右クリック属性使用selenium自动爬取想要爬取的内容_第3张图片上級システム設定使用selenium自动爬取想要爬取的内容_第4张图片クリック環境変数使用selenium自动爬取想要爬取的内容_第5张图片選択Pathクリック編集ボタン使用selenium自动爬取想要爬取的内容_第6张图片選択新規、ブラウザの場所をコピーして記入すればいいです.
以上の操作を完了してパソコンを再起動すると、次のコードを実行できます.
3、コードは以下の通り:
#coding:utf-8
from selenium import webdriver
#  selenium               
self = webdriver.Chrome()  
#      
self.get('https://yuedu.baidu.com/book/list/3001?show=0')  
total_book = self.find_element_by_id('bd')
#        div               div
books = total_book.find_elements_by_class_name('book ')  
#  for                
for book in books:  
    #         
	print (book.text + '
') # self.quit()

seleniumは私に多くの助けをもたらすことができると思います.例えば、あるサイトに登って、スクリプトを書いて、仕事が終わってからスクリプトを実行することができます.次の日会社に行ってから、取りたいものを登ってください.