詳細:wordcloudで語群を描く

2465 ワード

   https://blog.csdn.net/heyuexianzi/article/details/76851377
https://mp.weixin.qq.com/s/0Bw8QUo1YfWZR_Boeaxu_Q
      https://www.cnblogs.com/delav/p/7845539.html

#-- coding: utf-8 -- import jieba from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator import matplotlib.pyplot as pl
カスタム分詞辞書のロード
jieba.load_userdict(「news.txt」)
分析対象テキスト
import codecs file = codecs.open(‘laojiumen.txt’, ‘r’, encoding=’utf-8’) content = file.read() file.close()
特殊語のロード
jieba.add_word(u’二月紅’)
ストップワードを外す
# words_list1 = [] word_generator = jieba.Cut(content,cut_all=False)#は反復器with open(‘outwords.txt’,‘r’,encoding=’utf-8’)as f:unicode_を返します.text=f.read()f.close()#outwordsテキスト中の語のフォーマットは「一語一行」for word in word_generator: if word.strip() not in unicode_text: words_list1.append(word)
類義語置換
words_list = [] for seg in words_List 1:if len(seg)>1:if seg="二爺":seg="二月赤"print(type(seg))words_list.append(seg); words_list = ’ ‘.join(words_list)#listを文字列に変換
しゅうはすうけいさん
segStat = {} for seg in words_list: if seg in segStat: segStat[seg] += 1 else: segStat[seg] = 1 print(segStat)
語群の作成
wc = WordCloud(background_color='white',#背景色max_words=1000,#最大語数#mask=None,#このパラメータ値をグラフとして語群を描画します.このパラメータが空でない場合、widthとheightはmax_font_size=100を無視され、#フォントの最大値font_path="C:/Windows/Fonts/SimHei.ttf"、#表示口文字型文字化けの問題を解決し、C:/Windows/Fonts/Directoryにアクセスできます.フォントを変更random_state=42,#は単語ごとにPIL色scale=2,#width=1000,#ピクチャの幅#height=860#ピクチャの長さ)wcを返す.generate(words_list) pl.imshow(wc) pl.axis(“off”) pl.show()
下図を使用して語群を描画する
import numpy as np import PIL.Image as Image coloring = np.array(Image.open(“C:/Users/Administrator/Pictures/pkq.jpg”)) wc = WordCloud(background_color='white',#背景色max_words=1000,#最大語数mask=color,#このパラメータ値をグラフとして語群を描画します.このパラメータが空でない場合、widthとheightはmax_font_size=100を無視され、#表示フォントの最大値font_path="C:/Windows/Fonts/SImHei.ttf"、#表示口文字型文字化けの問題を解決し、C:/Windows/Fonts/Fonts/ディレクトリにアクセスできます.フォントrandom_を交換してくださいstate=42,#は単語ごとにPIL色scale=2,#width=1000,#ピクチャの幅#height=860#ピクチャの長さ)wcを返す.generate(words_list) image_colors = ImageColorGenerator(coloring) pl.imshow(wc.recolor(color_func=image_colors)) pl.imshow(wc) pl.axis(“off”) pl.show()
“`