PythonベースのScrapy爬虫類入門:ページ抽出

13469 ワード

目次
  • Pythonに基づくScrapy爬虫類入門:環境構築
  • PythonベースのScrapy爬虫類入門:ページ抽出
  • Pythonに基づくScrapy爬虫入門:画像処理
  • 次に、図虫網を例に画像をキャプチャする爬虫類プロジェクトを作成します.
    一、内容分析
    図虫网を开けて、上部のメニューの“発见”“ラベル”の中で各种のピクチャーに対する分类で、1つのラベルをクリックして、例えば“美人”、ホームページのリンクは:https://tuchong.com/tags/美女/、爬虫類の入り口として、このページを分析します.
    ページを開くと、それぞれの図集が表示されます.図集をクリックすると、画面全体を閲覧できます.下にスクロールすると、ページ番号のページをめくる設定がなく、より多くの図集が表示されます.Chrome右クリック「要素をチェック」開発者ツールを開き、ページのソースコードをチェックします.内容部分は以下の通りです.