学習ノート第14編の知識はソーシャルネットワークの分析にほかならない.
711 ワード
今日先生はソーシャルネットワークの内容分析に関するプロジェクトを分析させました.使用するのはhttps://www.jianshu.com/p/3b2a1895a12dに表示されます.このプロジェクトは主に、Webサイトを知っているユーザーの関心関係に基づいて、ソーシャルネットワークを分析しています.使用したデータには、2.6万人のユーザー、461件の注目接続、72万件の問題が含まれています.データダウンロードはここでクリックしてリンクを開き、実装コードはここでクリックしてリンクを開く.文章は社交データの統計関係、ネットワークの全体的な特徴、ネットワーク接続分析とホットな話題分析を分析した.
コード にインポートする.
コード
crawler
フォルダ:爬虫部分、広さ優先ポリシーで知識データを爬取し、csv形式で保存する(この部分のコードは現在バージョンが間違っており、爬虫したデータファイルはzhihu_database.py
と接続できないほか、topicの爬虫漏れの問題があり、修復される必要がある)zhihu_schema.sql
:SQLiteデータベースのschema zhihu_database.py
:csvのデータをデータベースのzhihu_analysis.py
:データベースからデータを抽出し、分析します.(このプログラムを実行すると実験結果が得られ、zhihu.dbファイルのパスに注意)