python爬虫類:百度雲盤を這い出す
6870 ワード
ネット上で见た教程、しかし私はその教程の书く乱れを嫌って(最后に私もあまり上手ではありませんが、ははは)、手当たり次第に1つ书きました
主に嫌盤はあれらの気持ち悪い広告を探して、このように直接ダウンロードして、目はずっとさわやかになりました.
pyinstallでEXEファイルにパッケージすると、静かにダウンロードできます...
ネット上で见た教程、しかし私はその教程の书く乱れを嫌って(最后に私もあまり上手ではありませんが、ははは)、手当たり次第に1つ书きました
主に嫌盤はあれらの気持ち悪い広告を探して、このように直接ダウンロードして、目はずっとさわやかになりました.
pyinstallでEXEファイルにパッケージすると、静かにダウンロードできます...
#!/usr/bin/python
# -*- encoding:utf-8 -*-
import requests
from bs4 import BeautifulSoup import sys reload(sys) sys.setdefaultencoding('utf-8') def yunpan_search(key): url='http://www.wangpansou.cn/s.php?q='+key html=requests.get(url) soup=BeautifulSoup(html.text,"lxml") url_get=soup.find_all('a',{'class':'cse-search-result_content_item_top_a'}) info_get=soup.find_all('div',{'class':'cse-search-result_content_item_mid'}) f = open('baidu_source.txt','w') for i in range(len(url_get)): href=url_get[i]['href'] title='' for c in url_get[i].children: title+=c.string.strip() information='' for info in info_get[i].children: information+=info.string.strip().replace('
','') print str(i+1)+'_'*60 print ' --'+href+'
'+' --'+title+'
'+' --'+information+'
' f.write(str(i+1)+'. _____________________________________________________________________
') f.write(' --'+href+'
'+' --'+title+'
'+' --'+information+'
') f.close() if __name__=='__main__': key=raw_input('please input what you want to look for:') yunpan_search(key) print('finish')