PythonはCSVファイルをどう読みますか?


CSVファイルは、テーブルデータを配置するための特定の構造を使用した純粋なテキストファイルです。
CSVファイルの内容は次のように見えるべきです。
column 1 name,column 2 name,column 3 name
first row data 1,first row data 2,first row data 3
second row data 1,second row data 2,second row data 3

各データはどのようにカンマで区切られますか?通常、第1の行は、各データブロックを識別する。つまり、データ列の名前。その後の各行はすべて実際のデータで、ファイルサイズに制限されます。
CSVファイルは通常、大量のデータを処理するプログラムで作成されます。これらは表計算ドキュメントとデータベースからデータを導出したり、データを導入したり、他のプログラムで使用する便利な方法です。例えば、データマイニングプログラムの結果をCSVファイルにエクスポートして、データを解析したり、プレゼンテーションのためにグラフを作成したり、レポートを発表したりするために表計算ドキュメントに導入してもいいです。
CSVファイルはプログラミングで簡単に処理できます。テキストファイルの入力と文字列操作をサポートする言語(Pythonなど)は、直接CSVファイルを使用することができます。
CSVファイルの内容を読みだします。
Pythonでは、csvライブラリを使用してCSVファイルの内容を読み取ります。ファイルを読む前に、a.csvのファイルを作成します。内容は以下の通りです。
名前、部署、月
John Smith、Acceounting、November
Erica Meyers,IT,March
ファイル作成が完了したら、ファイルの内容を読み取るためのプログラムを開始します。

import csv

with open('a.csv') as csv_file:
  csv_reader = csv.reader(csv_file,delimiter=',')
  line_count = 0

  for row in csv_reader:
    if line_count == 0:
      print(f'Column names are {", ".join(row)}')
      line_count += 1
    else:
      print(f'\t{row[0]} works in the {row[1]} department, and was born in {row[2]}.')
      line_count += 1
    print(f'Processed {line_count} lines.')
CSVファイルにデータを書き込みます。
上で内容を読み取るプログラムを作成しました。ファイルを書くプログラムを続けます。b.csvファイルに書きます。

import csv

with open('b.csv', mode='w') as employee_file:
  employee_writer = csv.writer(employee_file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)

  employee_writer.writerow(['John Smith', 'Accounting', 'November'])
  employee_writer.writerow(['Erica Meyers', 'IT', 'March'])
csvライブラリを使って読み書きの効率が比較的低いと感じたら、コードが多すぎます。より効率的な方法を紹介します。
pandsでcsvを読みます
c.csvファイルがあるとしたら、具体的な内容は以下の通りです。
Name,Hire Date,Salary,Sick Days remaning
Graam Chopman、03/15/14,50000.00,10
John Cleeese、06/01/15,65000.00,8
エリックIdle、05/12/14,4500.00,10
Terry Jones、11/01/13,70000.00,3
Terry Glliam,08/12/14,4800.00,7
Michael Palin、05/23/13,66000.00,8
pansdasでcsvを読みだします。

import pandas
df = pandas.read_csv('hrdata.csv')
print(df)

#    df

#       Name Hire Date  Salary Sick Days remaining
# 0 Graham Chapman 03/15/14 50000.0          10
# 1   John Cleese 06/01/15 65000.0          8
# 2    Eric Idle 05/12/14 45000.0          10
# 3   Terry Jones 11/01/13 70000.0          3
# 4  Terry Gilliam 08/12/14 48000.0          7
# 5  Michael Palin 05/23/13 66000.0          8
pandsでcsvを書きます
新しい列名でデータを新しいCSVファイルに書きましょう。

import pandas
df = pandas.read_csv('hrdata.csv', 
      index_col='Employee', 
      parse_dates=['Hired'],
      header=0, 
      names=['Employee', 'Hired', 'Salary', 'Sick Days'])
df.to_csv('d.csv')

# d.csv    

# Employee,Hired,Salary,Sick Days
# Graham Chapman,2014-03-15,50000.0,10
# John Cleese,2015-06-01,65000.0,8
# Eric Idle,2014-05-12,45000.0,10
# Terry Jones,2013-11-01,70000.0,3
# Terry Gilliam,2014-08-12,48000.0,7
# Michael Palin,2013-05-23,66000.0,8
CSVファイルを読み込む基礎知識があれば、導入データを処理する必要がある時は、まごまごしません。基本的なCSV Pythonライブラリは、多くのCSV読み取り、処理、作成タスクを簡単に処理することができます。多くのデータが読み込まれて処理されている場合は、パンダガーはまた、迅速かつ簡単なCSV処理機能を提供します。
以上はPythonがCSVファイルの詳細をどう読み、書きますか?PythonについてCSVファイルの資料を読みます。他の関連記事に注目してください。