Pandasデフォルト処理
1881 ワード
null/Nene/NaN nullはデータベースによく登場しますNoneはpythonの欠落値で、タイプはNoneType NaNでもpythonの欠落値です.数値ではありませんか.floatはpandasとNumpyでNoneをNaNに置き換えますが、データベースにインポートする場合はNaNをNoneに置き換える必要があります.
NULL値の検出
isnull() notnull()
空の値を追加
Numeric容器はNoneをNaNに変換します
バッチ変換
すべてのNanをNoneに変換
object容器が貯まるNone
Null値の計算
义齿
NaN演算の結果はNaN
statistics and computational methods(統計計算)
NaNは空っぽにされます
GroupBy
グループ内のNull値は無視されます
洗浄空の値
空の値を入力
fillna
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
パラメータ value : scalar, dict, Series, or DataFrame method:{‘backfill’,‘bfill’,‘pad’,‘ffill’,None},default None(bfillは後の値で埋め込まれ、ffillは逆) axis : {0 or ‘index’, 1 or ‘columns’} inplace : boolean, default False limit : int, default None downcast : dict, default is None
戻り値 filled : DataFrame
Interpolation
replace
NULL行または列の削除
DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
パラメータ axis : {0 or ‘index’, 1 or ‘columns’}, or tuple/list thereof how : {‘any’, ‘all’} thresh : int, default None subset : array-like inplace : boolean, default False
戻る dropped:DataFrame参考文献:http://python.jobbole.com/87266/http://pandas.pydata.org/pandas-docs/stable/missing_data.html None Nan
NULL値の検出
isnull() notnull()
空の値を追加
Numeric容器はNoneをNaNに変換します
In [20]: s = pd.Series([1, 2, 3])
In [21]: s.loc[0] = None
In [22]: s
Out[22]:
0 NaN
1 2.0
2 3.0
dtype: float64
バッチ変換
df1 = df.where((pd.notnull(df)), None)
すべてのNanをNoneに変換
object容器が貯まるNone
In [23]: s = pd.Series(["a", "b", "c"])
In [24]: s.loc[0] = None
In [25]: s.loc[1] = np.nan
In [26]: s
Out[26]:
0 None
1 NaN
2 c
dtype: object
Null値の計算
义齿
NaN演算の結果はNaN
statistics and computational methods(統計計算)
NaNは空っぽにされます
GroupBy
グループ内のNull値は無視されます
洗浄空の値
空の値を入力
fillna
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
パラメータ
戻り値
Interpolation
replace
NULL行または列の削除
DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
パラメータ
戻る