Pandasデフォルト処理

1881 ワード

パンダス

null/Nene/NaN nullはデータベースによく登場しますNoneはpythonの欠落値で、タイプはNoneType NaNでもpythonの欠落値です.数値ではありませんか.floatはpandasとNumpyでNoneをNaNに置き換えますが、データベースにインポートする場合はNaNをNoneに置き換える必要があります.
NULL値の検出
isnull() notnull()
空の値を追加
Numeric容器はNoneをNaNに変換します

In [20]: s = pd.Series([1, 2, 3])

In [21]: s.loc[0] = None

In [22]: s
Out[22]: 
0    NaN
1    2.0
2    3.0
dtype: float64

バッチ変換

df1 = df.where((pd.notnull(df)), None)

すべてのNanをNoneに変換
object容器が貯まるNone

In [23]: s = pd.Series(["a", "b", "c"])

In [24]: s.loc[0] = None

In [25]: s.loc[1] = np.nan

In [26]: s
Out[26]: 
0    None
1     NaN
2       c
dtype: object

Null値の計算
义齿
NaN演算の結果はNaN
statistics and computational methods(統計計算)
NaNは空っぽにされます
GroupBy
グループ内のNull値は無視されます
洗浄空の値
空の値を入力
fillna
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
パラメータ

value : scalar, dict, Series, or DataFrame

method:{‘backfill’,‘bfill’,‘pad’,‘ffill’,None},default None(bfillは後の値で埋め込まれ、ffillは逆)

axis : {0 or ‘index’, 1 or ‘columns’}

inplace : boolean, default False

limit : int, default None

downcast : dict, default is None

戻り値

filled : DataFrame

Interpolation
replace
NULL行または列の削除
DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
パラメータ

axis : {0 or ‘index’, 1 or ‘columns’}, or tuple/list thereof

how : {‘any’, ‘all’}

thresh : int, default None

subset : array-like

inplace : boolean, default False

戻る

dropped:DataFrame参考文献:http://python.jobbole.com/87266/http://pandas.pydata.org/pandas-docs/stable/missing_data.html None Nan

C++歴史の悟り

Capistranoデプロイ後にプロセスのリビジョンを確認する(scm＝git版)