心鶏のスープをとる

3368 ワード

ホームページ制作

Pythonコード

import requests
import re

url = 'http://www.59xihuan.cn/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}

text = requests.get(url, headers=headers).content.decode()
for i in range(64783, 64793):
    page = re.findall(r'div id="humorContent_{}" class="pic_text1"(.*?)'.format(str(i)), text, re.DOTALL)
    print(page[0])
    print('*' * 40)

効果スクリーンショット

締め括りをつける
ホームページ自体に問題がありますが、私の正規表現は大丈夫です.今の足りないところは、ページをめくってデータを取ることができません.データの保存と整理ができます.これからは趣味でもっと上の階に行きたいです.

MongoDBインストール設定パスワード登録

【LeetCode題解-005】longest Palindrome Substring