Python-wordcloudライブラリの使用
3832 ワード
目次
wordcloudライブラリの基本的な紹介
wordcloudライブラリの使用説明
wordcloudアプリケーションの例
wordcloudライブラリの基本的な紹介
wordcloudライブラリの概要 wordcloudは優れた語雲展示サードパーティライブラリ です.語群は語を基本単位とし、テキスト をより直感的かつ芸術的に展示する.
wordcloudライブラリのインストール
(cmdコマンドライン)pip install wordcloud
依存ライブラリ:numpy(pip install numpy)、matplotlib(インストールパッケージのダウンロード)https://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib)
wordcloudライブラリの使用説明
wordcloudライブラリの基本的な使用 wordcloudライブラリワードクラウドをWordCloudオブジェクトとして wordcloud.WordCloud()は、テキストに対応する語群 を表すは、テキスト中の語の出現頻度などのパラメータに基づいて語群 を描画することができる.語群の描画形状、寸法、色は に設定できる.
wordcloudライブラリの一般的な方法 w = wordcloud.WordCloud() WordCloudオブジェクトベース 構成パラメータ、テキストのロード、出力ファイル wordcloudライブラリの一般的な方法
方法
説明
w.generate(txt)
WrodCloudオブジェクトwへのテキストtxtのロード
w.to_file(filename)
語群を画像ファイルとして出力する.pngまたは.jpgフォーマット
テキスト→ワードクラウド区切り:単語 をスペースで区切ります.統計:単語の出現回数と のフィルタリングフォント:統計に基づいて番号 を構成する.レイアウト:カラー環境寸法 オブジェクトパラメータの設定
w = wordcloud.WordCloud()
パラメータ
説明
width
語群オブジェクト生成ピクチャの幅を指定し、デフォルト400ピクセル
height
語群オブジェクト生成ピクチャの高さを指定し、デフォルト200ピクセル
min_font_size
単語群のフォントの最小サイズを指定します.デフォルトは4番です.
max_font_size
ワードクラウド内のフォントの最大サイズを指定し、高さに応じて自動的に調整します.
font_step
ワードクラウド内のフォント番号のステップ間隔を指定します.デフォルトは1です.
font_path
フォントファイルのパスを指定します.デフォルトNone
max_words
指示語群に表示される最大単語数、デフォルト200
stop_words
語群の除外語リストを指定します.すなわち、表示されない単語リスト>>w=wordcloud.WordCloud(stop_word={"Python"})
mask
語群の形状を指定します.デフォルトは長方形で、imread()関数を参照する必要があります.
background_color
語群ピクチャの背景色を指定します.デフォルトは黒です.
wordcloudアプリケーションの例
英語のテキスト
中国語テキスト
フォントfont_が設定されていませんpath="xxx.ttf":
本文はPythonの記録を学ぶためだけで、資料は中国大学MOOC《Python言語設計》―嵩天に由来する.
wordcloudライブラリの基本的な紹介
wordcloudライブラリの使用説明
wordcloudアプリケーションの例
wordcloudライブラリの基本的な紹介
wordcloudライブラリの概要
wordcloudライブラリのインストール
(cmdコマンドライン)pip install wordcloud
依存ライブラリ:numpy(pip install numpy)、matplotlib(インストールパッケージのダウンロード)https://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib)
wordcloudライブラリの使用説明
wordcloudライブラリの基本的な使用
wordcloudライブラリの一般的な方法
方法
説明
w.generate(txt)
WrodCloudオブジェクトwへのテキストtxtのロード
w.to_file(filename)
語群を画像ファイルとして出力する.pngまたは.jpgフォーマット
import wordcloud
w = wordcloud.WordCloud(); #
w.generate("wordcloud by Python"); #
w.to_file("pywordcloud.png"); #
テキスト→ワードクラウド
w = wordcloud.WordCloud()
パラメータ
説明
width
語群オブジェクト生成ピクチャの幅を指定し、デフォルト400ピクセル
height
語群オブジェクト生成ピクチャの高さを指定し、デフォルト200ピクセル
min_font_size
単語群のフォントの最小サイズを指定します.デフォルトは4番です.
max_font_size
ワードクラウド内のフォントの最大サイズを指定し、高さに応じて自動的に調整します.
font_step
ワードクラウド内のフォント番号のステップ間隔を指定します.デフォルトは1です.
font_path
フォントファイルのパスを指定します.デフォルトNone
max_words
指示語群に表示される最大単語数、デフォルト200
stop_words
語群の除外語リストを指定します.すなわち、表示されない単語リスト>>w=wordcloud.WordCloud(stop_word={"Python"})
mask
語群の形状を指定します.デフォルトは長方形で、imread()関数を参照する必要があります.
background_color
語群ピクチャの背景色を指定します.デフォルトは黒です.
wordcloudアプリケーションの例
英語のテキスト
import wordcloud
txt = "life is short, you need python";
w = wordcloud.WordCloud(background_color = "white");
w.generate(txt);
w.to_file("pywcloud.png");
中国語テキスト
import jieba
import wordcloud
txt = " , , 。";
#wordcloud , ,
w = wordcloud.WordCloud(width=1000, height=700, font_path="Song.ttf");
#
w.generate(" ".join(jieba.lcut(txt)));
w.to_file("pywcloud2.png");
フォントfont_が設定されていませんpath="xxx.ttf":
本文はPythonの記録を学ぶためだけで、資料は中国大学MOOC《Python言語設計》―嵩天に由来する.