#python簡単なデータパケット統計を作成

3498 ワード

pythonは簡単なデータパケット統計をします
年ごとにidが現れる回数を統計すると、サンプルが大きいときは比較的速いです.
# -*- coding=utf-8 -*-
import pandas as pd
import csv    #  csv     csv  

csv_file=open('D:/mystata/harvard-1.0/patent/utility_num/utility1.0.csv',encoding="utf-8")    #  csv  
csv_reader_lines = csv.reader(csv_file)   #    csv  
date=[]    #        csv    
for one_line in csv_reader_lines:
    date.append(one_line)    #    csv          ‘date’ 

df = pd.DataFrame(date,columns=["id","year"])  #     DataFrame ,       “id” “year”
gp = df.groupby(by=["year","id"])   # year  
gp.size()  #,      id     
newdf=gp.size()
newdf.reset_index(name='times')
#result = pd.value_counts(gp)
newdf.to_csv('D:/mystata/harvard-1.0/patent/utility_num/every_utility_num.csv')   #     csv