seleniumを使用して自動的に登りたい内容を抽出します

3410 ワード

1、seleniumのインストール
CMDでpip install seleniumを入力すればいいです(ダウンロードソースを指定できます.詳細はこのリンクをクリックしてください)https://blog.csdn.net/weixin_44548394/article/details/882254652、Googleブラウザドライバchromedriver(火狐などの他のブラウザを使用することもできます)をダウンロードし、使用してウェブサイトをダウンロードします.http://chromedriver.storage.googleapis.com/index.html注意:ダウンロードする前に、Googleブラウザのバージョン

を確認して、選択したボタンをクリックしてください.Google Chrome

についてGoogleブラウザドライバをダウンロードして、あなたのブラウザバージョンに最も近いバージョンを選択します.例えば、私のバージョンは71.0.3578.98です.では、私のブラウザバージョンに最も近いバージョン

を選択して、ダウンロードしたファイルをブラウザのフォルダに解圧します.(ブラウザを選択し、右クリックしてフォルダを開く場所を選択して、それを入れます)
次に、環境変数を設定してこのコンピュータを選択する必要があります.右クリック属性

上級システム設定

クリック環境変数

選択Pathクリック編集ボタン

選択新規、ブラウザの場所をコピーして記入すればいいです.
以上の操作を完了してパソコンを再起動すると、次のコードを実行できます.
3、コードは以下の通り:

#coding:utf-8
from selenium import webdriver
#  selenium               
self = webdriver.Chrome()  
#      
self.get('https://yuedu.baidu.com/book/list/3001?show=0')  
total_book = self.find_element_by_id('bd')
#        div               div
books = total_book.find_elements_by_class_name('book ')  
#  for                
for book in books:  
    #         
	print (book.text + '
') 
#              
self.quit()

seleniumは私に多くの助けをもたらすことができると思います.例えば、あるサイトに登って、スクリプトを書いて、仕事が終わってからスクリプトを実行することができます.次の日会社に行ってから、取りたいものを登ってください.

Linuxラーニング:パッケージ管理+共通コマンド

pytestで1ファイル／1テストだけ実行したい（他よく使うオプション）