#python簡単なデータパケット統計を作成
3498 ワード
pythonは簡単なデータパケット統計をします
年ごとにidが現れる回数を統計すると、サンプルが大きいときは比較的速いです.
年ごとにidが現れる回数を統計すると、サンプルが大きいときは比較的速いです.
# -*- coding=utf-8 -*-
import pandas as pd
import csv # csv csv
csv_file=open('D:/mystata/harvard-1.0/patent/utility_num/utility1.0.csv',encoding="utf-8") # csv
csv_reader_lines = csv.reader(csv_file) # csv
date=[] # csv
for one_line in csv_reader_lines:
date.append(one_line) # csv ‘date’
df = pd.DataFrame(date,columns=["id","year"]) # DataFrame , “id” “year”
gp = df.groupby(by=["year","id"]) # year
gp.size() #, id
newdf=gp.size()
newdf.reset_index(name='times')
#result = pd.value_counts(gp)
newdf.to_csv('D:/mystata/harvard-1.0/patent/utility_num/every_utility_num.csv') # csv