python爬虫類:百度雲盤を這い出す

6870 ワード


ネット上で见た教程、しかし私はその教程の书く乱れを嫌って(最后に私もあまり上手ではありませんが、ははは)、手当たり次第に1つ书きました
主に嫌盤はあれらの気持ち悪い広告を探して、このように直接ダウンロードして、目はずっとさわやかになりました.
pyinstallでEXEファイルにパッケージすると、静かにダウンロードできます...
 
#!/usr/bin/python
# -*- encoding:utf-8 -*-

import requests
from bs4 import BeautifulSoup import sys reload(sys) sys.setdefaultencoding('utf-8') def yunpan_search(key): url='http://www.wangpansou.cn/s.php?q='+key html=requests.get(url) soup=BeautifulSoup(html.text,"lxml") url_get=soup.find_all('a',{'class':'cse-search-result_content_item_top_a'}) info_get=soup.find_all('div',{'class':'cse-search-result_content_item_mid'}) f = open('baidu_source.txt','w') for i in range(len(url_get)): href=url_get[i]['href'] title=''  for c in url_get[i].children: title+=c.string.strip() information=''  for info in info_get[i].children: information+=info.string.strip().replace('
','') print str(i+1)+'_'*60 print ' --'+href+'
'+' --'+title+'
'+' --'+information+'

' f.write(str(i+1)+'. _____________________________________________________________________
') f.write(' --'+href+'
'+' --'+title+'
'+' --'+information+'

') f.close() if __name__=='__main__': key=raw_input('please input what you want to look for:') yunpan_search(key) print('finish')