Pythonで陳奕迅の新曲「私たち」の10万件の評論の新しい発見を登った.

3875 ワード

最近、「レトロ」を題材にした映画があり、先火は放送されていない.それは劉若英の処女作「後の私たち」だ.青春、爱情、梦想、ずっと“レトロ”の题材の核心の要素で、映画は今まだ上映していませんが、しかし先に発表したテーマ曲《私达》、すでに多くの人を虐げて泣きました.MVの中で、歌声は清らかで浅くて、あれらの年爱情の中の残念な思いを诉えています.「私の最大の遺憾は、あなたの遺憾であり、私と関係がある」と、一緒に感じてみましょう.この歌は「後の私たち」のテーマ曲で、ネット易雲音楽がオンラインになった当日、千万+放送量を席巻し、今ではネット易雲のコメントだけで10万件を突破した.网易云音楽はずっと私のあこがれの“神坛”で、音楽を闻いて心を动かすコメントを见た时、高山流水.そこで歌の人気コメントをつかんで、図表、语云を作って展示して、この歌に対して最も感じられるコメント内容は何ですか.
これはとても面白いと感じて、简単な缲り返しは車輪を早くして、全体の1つの过程を见て勉强して记录します!
爬虫類の基本的なネットワーク操作は記録されず、次はソースを放出します!
効果:
知識ポイント1:
pipインストールfailed to create process
解決策:python 35-m pip install pyecharts
ナレッジポイント2:
WordCloudのインストール時にpipはインストールできません
解決策:行くhttps://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloudは、あなたのパソコンのpyバージョンとパソコン環境をダウンロードし、コマンドウィンドウにpipをインストールします.
知識ポイント3:
Pyechartsの使用については、以下を参照してください.https://blog.csdn.net/u013421629/article/details/78183637
実行に成功すると、現在のプログラムディレクトリの下にrenderが生成されます.htmlファイル、ブラウザで開くと効果が表示されます
ナレッジポイント4:
WordCloudの使用方法については、以下を参照してください.https://blog.csdn.net/fontthrone/article/details/72775865
ソース:
#         

import requests
import re
import json


#req = request.Session()
comm_url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_551816010?csrf_token=814692a9769375fcc43f179fc134a7cc'
header = {
    'Origin':'http://music.163.com',
    'Host':'music.163.com',
    'Referer':'http://music.163.com/song?id=551816010',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
    }

##########################

#post key   
user_data = {
    'params':'0azFNHOQXrQR3kUdGq6ILvm7trulgN++kAard2ModFG2SiakjPNcHoc6FK//vCQJlG/2uoRQeCdFrmNHgv1TStIAfMQxvQKPoXFymF0NJFsfQClakpk2+qAcFsmckmKV+gsJxFOyt/7h2tK717d1oOPE5KfGRUDXdFyLNOtm5oNq0YTaKZb9wz8XHQEp8L1if4e5xWiWId91eGWS3zvRKFHDh6Bom5cUjp6zlFUrJro=',
    'encSecKey':'24105f0c5aa04aa4b24b2c9a06646974e03c8c6b74320fc662bf84432d97f9ed05fd48df6a970f6b377dff894bd3f13e362a870d997732320f51b631b190f4c9a0201070f691591510a858cc54fd962ef1ff445dcc8493e021e4524e8057ceefc82584272176e181501f7e5394da126ea058cedd30544ad304871b82db4cdee4'
    }


result = requests.post(comm_url,headers = header,data = user_data,timeout = 8)
result.encoding = "utf-8"
data = json.loads(result.text)

print(result)

hot_comments = []

#    
for hot_comment in data['hotComments']:
    item = {
        'nickname' : hot_comment['user']['nickname'],
        'content' : hot_comment['content'],
        'likedCount' : hot_comment['likedCount']
        }
    hot_comments.append(item)
    

nickname_list = [content['nickname'] for content in hot_comments ]
content_list = [content['content'] for content in hot_comments ]
likedCount_list = [content['likedCount'] for content in hot_comments ]


#    
from pyecharts import Bar

bar = Bar("        ")
bar.add("   ",nickname_list,likedCount_list,is_stack = True,mark_line = ["min","max"],mark_point=["average"],is_more_utils=True)
bar.render()

#  
from wordcloud import WordCloud
import matplotlib.pyplot as plt

content_text = " ".join(content_list)

wordcloud = WordCloud(font_path=r'C:\Users\S.Assassaisn\Desktop\123.ttf' ,max_words=200,width=1920, height=1080).generate(content_text)

plt.figure()
plt.imshow(wordcloud,interpolation='bilinear')
plt.axis('off')
plt.show()

print("ok!!!")

原文住所:http://mp.weixin.qq.com/s?__biz=MzAxMjUyNDQ5OA==&mid=2653556154&idx=1&sn=9019a8f73f697cf8e041b68055470c12&chksm=806e2307b719aa11a336373ca56fffcc53cd4f537ecd0027aa81adb5f14e81f05e9efa278039&mpshare=1&scene=23&srcid=0420kYEeuWXv0RV5qEZfIHnR#rd