pandas読み取りcsv処理時報エラー:ParserError:Error tokenizing data.C error: Expected 1 fields in line 29, saw 2

852 ワード

csvファイルのデフォルトはカンマ区切り文字ですが、中国語ではカンマの使用率が高く、中国語のデータを這い出すと混同されやすいので、pandasを使用してcsvに書き込むときにパラメータsep='t'、すなわちtabを区切り文字として書き込むように設定できます.結局tabは中国語の習慣で使うのは少ないですね.このようにcsvを読み出してデータ処理を行う場合は、パラメータdelimiterを追加することを忘れないでください.

delimiter="\t"
#    ：
df=pd.read_csv('path',delimiter="\t")

さもないとdataframeを印刷してみると、ずらりと並んでいないので、後でcsvを処理するときにタイトルのようなエラーが発生する可能性があります.

ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2

Excelのワークシートをまとめる関数

PHP Catalan数のいくつかの応用