Python爬虫ノート(3)-丁香園に登って伝言を残す
12550 ワード
Python爬虫ノート(3)-丁香園に登って伝言を残す 丁香園に登って伝言を残した:主に模擬登録 を用いた.
丁香園に登って伝言を取ります:主に模擬登録を使いました
丁香園に登って伝言を取ります:主に模擬登録を使いました
import requests, json, re, random,time
from bs4 import BeautifulSoup
from selenium import webdriver
from lxml import etree
class getUrl(object):
"""docstring for getUrl"""
def __init__(self):
self.headers={
"Connection": "keep-alive",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 "
"(KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
"Accept-Encoding": "gzip, deflate, sdch",
"Accept-Language": "zh-CN,zh;q=0.8"
}
def run(self):
browser = webdriver.Chrome()
browser.get('https://auth.dxy.cn/accounts/login?service=http://www.dxy.cn/bbs/index.html')
time.sleep(1)
#
js1 = 'document.querySelector("#j_loginTab1").style.display="none";'
browser.execute_script(js1)
time.sleep(1)
js2 = 'document.querySelector("#j_loginTab2").style.display="block";'
browser.execute_script(js2)
#
input_name = browser.find_element_by_name('username')
input_name.clear()
input_name.send_keys('*')#
input_pass = browser.find_element_by_name('password')
input_pass.clear()
input_pass.send_keys('*')
browser.find_element_by_xpath('//*[@class="form__button"]/button').click()
# ,
time.sleep(10)
cookie = browser.get_cookies()
cookie_dict = {
i['name']:i['value'] for i in cookie}
#
browser.get("http://www.dxy.cn/bbs/thread/626626#626626");
html = browser.page_source
tree = etree.HTML(html)
user = tree.xpath('//div[@id="postcontainer"]//div[@class="auth"]/a/text()')
content = tree.xpath('//td[@class="postbody"]')
for i in range(0,len(user)):
result = user[i].strip()+":"+content[i].xpath('string(.)').strip()
#
dir_file = open("DXY_records.txt",'a', encoding="utf-8")
dir_file.write(result+"
")
dir_file.write('*' * 80+"
")
dir_file.close()
print('*' * 5 +" "+'*' * 5)
if __name__ == '__main__':
geturl = getUrl()
geturl.run()
: “ ” , 。 ,42 。 30 。 , 。 , , , 。 。 。 。ECG、24 ; MRI ; 。 。 , , ?
********************************************************************************
lion000: , 。 、ECG、UCG、holter X-ray 。 “ ” : http://www.ccheart.com.cn/ccheart_site/Templates/jieru/200011/1-1.htm
********************************************************************************
xghrh: lion000 : , , 。 HOLTER , , 。 , , , , , 。 , , 。 1 , 、 、 , , 2002 Vol.28 No.2
********************************************************************************
keys: , 。 , , , MIR(MRA), 。