Pythonがcsvファイルを読み込むいくつかの方法
1582 ワード
データがcsv形式で格納されている場合があります.データを処理するには、まず読み取り操作が必要です.ここではいくつかのcsvの読み取り方法(pythonベース)をまとめた.
1.numpyによる読み出し
delimiterはセパレータでskiprowsは前のn行をスキップし、usecolsは使用する列数であり、例では3,4列を読み出す.
2.pandasで読み取る
同様にsepは上のdelimiterに相当し、区切り記号である.この関数にはdelimiterも含まれており、代替の区切り記号(csvは異なる区切り記号でデータを区切る)に属します.ヘッダーはカラム名であり、各カラムの名前であり、ヘッダー=1の場合、2行目をカラム名として2行目以下のデータが読み出されます.usecolsは同じで、何列目を読み込みますか.
たとえば、print(data[1])の値を表示すると、エラーが表示されます.私たちは次のプログラムを借りることができます.
3.Python I/Oでファイルを読み込む
またはDictReaderを使用すると、最初の行がラベルとして使用されます.
他にも方法がありますが、ここでも補足しません.
1.numpyによる読み出し
import numpy as np
data = np.loadtxt(open(" .csv","rb"),delimiter=",",skiprows=n,usecols=[2,3])
delimiterはセパレータでskiprowsは前のn行をスキップし、usecolsは使用する列数であり、例では3,4列を読み出す.
2.pandasで読み取る
import pandas as pd
data = pd.read_csv(r'C:\Users\lenovo\Desktop\parttest.csv',sep=',',header='infer',usecols=[5])
同様にsepは上のdelimiterに相当し、区切り記号である.この関数にはdelimiterも含まれており、代替の区切り記号(csvは異なる区切り記号でデータを区切る)に属します.ヘッダーはカラム名であり、各カラムの名前であり、ヘッダー=1の場合、2行目をカラム名として2行目以下のデータが読み出されます.usecolsは同じで、何列目を読み込みますか.
たとえば、print(data[1])の値を表示すると、エラーが表示されます.私たちは次のプログラムを借りることができます.
array=data.values[0::,0::] # ,
print(array[]) #array , data
3.Python I/Oでファイルを読み込む
import csv
filename='C:\\Users\\lenovo\\Desktop\\parttest.csv'
data = []
with open(filename) as csvfile:
csv_reader = csv.reader(csvfile) # csv.reader csvfile
#header = next(csv_reader) #
for row in csv_reader: # csv data
data.append(row[5]) # data
print(data)
またはDictReaderを使用すると、最初の行がラベルとして使用されます.
import csv
with open(filename) as csvfile:
reader = csv.DictReader(csvfile)
column = [row['weight'] for row in reader] # weight
print(column)
他にも方法がありますが、ここでも補足しません.