Pythonによるグラフ解析-グラフの可視化と中心性-


本稿ではグラフ解析について説明する.ここで「グラフ」という用語は、棒グラフまたは円グラフを参照しないが、グラフ理論の意味でグラフには、ノードとエッジのセットから構成されます.
グラフのよく知られた例としては、Twitterのネットワークにおけるユーザとツイートの関係、論文の引用関係、ウェブページ間のハイパーリンク関係がある.
データをグラフ形式に変換することにより,ノードとエッジを予測し,グラフ伝搬の流れを可視化することができる.この記事では、PythonとNetworkXを使って簡単なグラフ解析を行います.

まず、ダウンロードし、lesmisをロードします.GML .
ファイル.upload ()はデータを読み込みやすくなります.

NetworkXでアップロードされたデータに格納されているlesmisのグラフを視覚化します.


他のタイプのグラフがありますので、リンクを参照してください.


グラフ解析では,どの頂点が中心であるかを調べる.論文の引用関係では,基礎技術に関する論文が多く引用され,そのような論文が欠落した場合,引用関係グラフは分割される.
この場合、用紙は引用関係グラフの中心と考えられる.
中心性、程度中心性、固有ベクトル中心性、近接中心性、調停中心などを定量化するためのグラフメトリックが存在する.
まず、各グラフのヒートマップをプロットする関数を作成します.

次数の中心度を計算し,ヒートマップとしてプロットした.度中心性は、センターとして多くの他の頂点に接続している頂点を考慮するグラフメトリックです.


次は固有ベクトル中心性である.
固有ベクトル中心性は、それが周囲の頂点の中心性を考慮に入れて、それが多くの他の中央頂点に接続されるならば、頂点が中心であると思うグラフ距離です.


次に、近接性中心を計算し、ヒートマップとしてプロットする.近接性中心性は、グラフの他の頂点に短い距離で達することができる頂点として考えるグラフメトリックです.


最後に、betweenness中心性を計算し、ヒートマップとしてプロット.Betweenness Centrityは頂点として頂点を考慮するグラフメトリックです.その頂点の損失が多くの経路を断片化させるように.


また、NXの後に部品を書き換えることによって様々な中心性を計算することも可能である.


本稿では,まずグラフ解析におけるグラフの読み込み,可視化,最終的な中心性について説明した.