pandas読み取りcsv処理時報エラー:ParserError:Error tokenizing data.C error: Expected 1 fields in line 29, saw 2
852 ワード
csvファイルのデフォルトはカンマ区切り文字ですが、中国語ではカンマの使用率が高く、中国語のデータを這い出すと混同されやすいので、pandasを使用してcsvに書き込むときにパラメータsep='t'、すなわちtabを区切り文字として書き込むように設定できます.結局tabは中国語の習慣で使うのは少ないですね.このようにcsvを読み出してデータ処理を行う場合は、パラメータdelimiterを追加することを忘れないでください.
さもないとdataframeを印刷してみると、ずらりと並んでいないので、後でcsvを処理するときにタイトルのようなエラーが発生する可能性があります.
delimiter="\t"
# :
df=pd.read_csv('path',delimiter="\t")
さもないとdataframeを印刷してみると、ずらりと並んでいないので、後でcsvを処理するときにタイトルのようなエラーが発生する可能性があります.
ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2