Pythonデータ分析ライブラリpandas高級インターフェースdtの使用詳細


SeriesオブジェクトとDataFrameの列データはcat、dt、strの3つの属性インターフェース(accessors)を提供しています。分類データ、日付データ、文字列データにそれぞれ対応しています。これらのインターフェースを通じて、特定の機能を迅速に実現することができます。とても速いです。
今日はパンダスの公式文書を見て、次のような一般的なアプリをまとめました。
1.dt.dateとdt.normalize()は、日付の日付部分、つまり年月日だけを返します。しかし、違いはダテが返すSeriesはobjectタイプで、normalize()が返すSeriesはdatetime 64タイプです。
ここでまず簡単にdataframeを作成します。

2.dt.year、dt.month、dt.day、dt.hour、dt.minute、dt.second、dt.week(dt.weekofyearとdt.weekと同じ)日付の年、月、日、時間、分、秒と一年の中の第数週

3.dt.weekday(dt.days offekと同じ)は一週間の中の何曜日に戻りますか?0は月曜日、6は日曜日、dt.weekday_を表します。nameは何曜日の英語に戻りますか?

4.dt.dayoff yearは1年の数日目に戻ります。dt.quarterはそれぞれの日付をもらいます。それぞれ第数四半期です。

5 dt.is_モンズ.startとdt.is_モンズ.endは日付が毎月の最初の日か最後の日かどうかを判断します。monthをyearとquarterに換えることができます。日付は毎年または四半期の最初の日または最後の日ですか?

6.dt.is_leap_yearは閏年かどうか判断します。

7.dt.month_name()は月の英語名を返します。

補足知識:pands文字列と時間系列の処理strとdt
一、str属性
pansdasのSeriesにはstr属性があります。この属性を通して文字列処理の汎用関数を呼び出すことができます。
例えば、df''road'.str.co ntains('康庄大道')は文字列に'康庄大道'が含まれているデータを返します。
二、dt属性
pandsでは、時系列の処理に対して、dt属性を使います。
df['datetime'.dt.time]time(10,0)
二つのseriesのand比較は&演算子を使っています。
(df['datetime'].dt.time"(10,0))&(df['datetime').dt.time10時から12時までのデータを返します。
三、アプリ関数の例
df['time'=df['datetime].appy(lamda x:x.time()
以上は個人の経験ですので、参考にしていただければと思います。間違いがあったり、完全に考えていないところがあれば、教えてください。