pandasでExcelファイル(xlsx)が読み込めない時の対処法


環境について

pandas== 1.1.4
xlrd==2.0.1

エラーについて

pandasでExcelファイル(xlsx)を読み込む時に

import pandas as pd

df = pd.read_excel('sample.xlsx')

下記のエラーが発生する.

xlrd.biffh.XLRDError: Excel xlsx file; not supported

原因

Excelファイルを読み取るライブラリであるxlrdが2.0.0からxlsxファイルに対応しなくなったため.
https://xlrd.readthedocs.io/en/latest/changes.html

解決方法

2つの解決方法があります.

1.xlrdのバージョンを下げる

pip3 install xlrd==1.2.0

2.ファイルを読み取るライブラリをopenpyxlに変更する

pipでopenpyxlをインストールする.

pip3 install openpyxl

Excel読み取り時にライブラリを指定する.

df = pd.read_excel('sample.xlsx',engine="openpyxl")