Python-wordcloudライブラリの使用

3832 ワード

目次
wordcloudライブラリの基本的な紹介
wordcloudライブラリの使用説明
wordcloudアプリケーションの例
wordcloudライブラリの基本的な紹介
wordcloudライブラリの概要
  • wordcloudは優れた語雲展示サードパーティライブラリ
  • です.
  • 語群は語を基本単位とし、テキスト
  • をより直感的かつ芸術的に展示する.
    Python-wordcloud库的使用_第1张图片
    wordcloudライブラリのインストール
    (cmdコマンドライン)pip install wordcloud
    依存ライブラリ:numpy(pip install numpy)、matplotlib(インストールパッケージのダウンロード)https://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib)
    wordcloudライブラリの使用説明
    wordcloudライブラリの基本的な使用
  • wordcloudライブラリワードクラウドをWordCloudオブジェクトとして
  • wordcloud.WordCloud()は、テキストに対応する語群
  • を表す
  • は、テキスト中の語の出現頻度などのパラメータに基づいて語群
  • を描画することができる.
  • 語群の描画形状、寸法、色は
  • に設定できる.
    wordcloudライブラリの一般的な方法
  • w = wordcloud.WordCloud()
  • WordCloudオブジェクトベース
  • 構成パラメータ、テキストのロード、出力ファイル
  • wordcloudライブラリの一般的な方法
    方法
    説明
    w.generate(txt)
    WrodCloudオブジェクトwへのテキストtxtのロード
    w.to_file(filename)
    語群を画像ファイルとして出力する.pngまたは.jpgフォーマット
    import wordcloud
    
    w = wordcloud.WordCloud();  #      
    w.generate("wordcloud by Python"); #      
    w.to_file("pywordcloud.png"); #      

    テキスト→ワードクラウド
  • 区切り:単語
  • をスペースで区切ります.
  • 統計:単語の出現回数と
  • のフィルタリング
  • フォント:統計に基づいて番号
  • を構成する.
  • レイアウト:カラー環境寸法
  • オブジェクトパラメータの設定
    w = wordcloud.WordCloud()
    パラメータ
    説明
    width
    語群オブジェクト生成ピクチャの幅を指定し、デフォルト400ピクセル
    height
    語群オブジェクト生成ピクチャの高さを指定し、デフォルト200ピクセル
    min_font_size
    単語群のフォントの最小サイズを指定します.デフォルトは4番です.
    max_font_size
    ワードクラウド内のフォントの最大サイズを指定し、高さに応じて自動的に調整します.
    font_step
    ワードクラウド内のフォント番号のステップ間隔を指定します.デフォルトは1です.
    font_path
    フォントファイルのパスを指定します.デフォルトNone
    max_words
    指示語群に表示される最大単語数、デフォルト200
    stop_words
    語群の除外語リストを指定します.すなわち、表示されない単語リスト>>w=wordcloud.WordCloud(stop_word={"Python"})
    mask
    語群の形状を指定します.デフォルトは長方形で、imread()関数を参照する必要があります.
    background_color
    語群ピクチャの背景色を指定します.デフォルトは黒です.
    wordcloudアプリケーションの例
    英語のテキスト
    import wordcloud
    
    txt = "life is short, you need python";
    w = wordcloud.WordCloud(background_color = "white");
    w.generate(txt);
    w.to_file("pywcloud.png");

    Python-wordcloud库的使用_第2张图片
    中国語テキスト
    import jieba
    import wordcloud
    
    txt = "                              ,              ,                。";
    
    #wordcloud     ,      ,          
    w = wordcloud.WordCloud(width=1000, height=700, font_path="Song.ttf"); 
    
    #                 
    w.generate(" ".join(jieba.lcut(txt)));
    w.to_file("pywcloud2.png");

    Python-wordcloud库的使用_第3张图片
    フォントfont_が設定されていませんpath="xxx.ttf":
    Python-wordcloud库的使用_第4张图片
    本文はPythonの記録を学ぶためだけで、資料は中国大学MOOC《Python言語設計》―嵩天に由来する.