問題が発生--python-pandas-よくある問題の蓄積


質問-Error tokenizing data.C error:Expected 3 fields in line 20,saw 4
read_を使用csvタイムズエラー
data = pd.read_csv(inputfile, encoding='utf-8',header=None)

完全なエラーは次のとおりです.
   :

pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 20, saw 4

の原因となる
まずこのエラーはpandasでread_を使用することですcsvによるもので、read_を使用するのが一般的です.csv txtドキュメントまたはxlsなどの他のexcelフォーマットを読み込む
エラーの原因は、read.csvのデフォルト区切り記号が「,」カンマであるため、中間文字列にエラーがあります.
前はすべて1行がなくて","后ろは突然1行があって","この时この行のデータは2列になって、前は1列で、后ろは突然2列になって、この时プログラムはこのような间违いを报告します.そして解析したデータも異常です.
解決策
まず、pandasを使用してread_を読み出すようにcsv形式のファイルをデフォルトで使用してデータを記録することが望ましい.csvは一般的に問題ありません.
他の形式のファイルを読み込む必要がある場合は、区切り文字を明確にします.
次のようになります.
data = pd.read_csv(inputfile,  encoding='utf-8',header=None,sep = None) 

data = pd.read_csv(inputfile,  encoding='utf-8',header=None,sep = '\t')

data = pd.read_csv(inputfile,delimiter="\t")