学習ノート第14編の知識はソーシャルネットワークの分析にほかならない.


今日先生はソーシャルネットワークの内容分析に関するプロジェクトを分析させました.使用するのはhttps://www.jianshu.com/p/3b2a1895a12dに表示されます.このプロジェクトは主に、Webサイトを知っているユーザーの関心関係に基づいて、ソーシャルネットワークを分析しています.使用したデータには、2.6万人のユーザー、461件の注目接続、72万件の問題が含まれています.データダウンロードはここでクリックしてリンクを開き、実装コードはここでクリックしてリンクを開く.文章は社交データの統計関係、ネットワークの全体的な特徴、ネットワーク接続分析とホットな話題分析を分析した.
コード
  • crawlerフォルダ:爬虫部分、広さ優先ポリシーで知識データを爬取し、csv形式で保存する(この部分のコードは現在バージョンが間違っており、爬虫したデータファイルはzhihu_database.pyと接続できないほか、topicの爬虫漏れの問題があり、修復される必要がある)
  • zhihu_schema.sql:SQLiteデータベースのschema
  • zhihu_database.py:csvのデータをデータベースの
  • にインポートする.
  • zhihu_analysis.py:データベースからデータを抽出し、分析します.(このプログラムを実行すると実験結果が得られ、zhihu.dbファイルのパスに注意)