Pandasデフォルト処理

1881 ワード

null/Nene/NaN nullはデータベースによく登場しますNoneはpythonの欠落値で、タイプはNoneType NaNでもpythonの欠落値です.数値ではありませんか.floatはpandasとNumpyでNoneをNaNに置き換えますが、データベースにインポートする場合はNaNをNoneに置き換える必要があります.
NULL値の検出
isnull() notnull()
空の値を追加
Numeric容器はNoneをNaNに変換します
In [20]: s = pd.Series([1, 2, 3])

In [21]: s.loc[0] = None

In [22]: s
Out[22]: 
0    NaN
1    2.0
2    3.0
dtype: float64

バッチ変換
df1 = df.where((pd.notnull(df)), None)

すべてのNanをNoneに変換
object容器が貯まるNone
In [23]: s = pd.Series(["a", "b", "c"])

In [24]: s.loc[0] = None

In [25]: s.loc[1] = np.nan

In [26]: s
Out[26]: 
0    None
1     NaN
2       c
dtype: object

Null値の計算
义齿
NaN演算の結果はNaN
statistics and computational methods(統計計算)
NaNは空っぽにされます
GroupBy
グループ内のNull値は無視されます
洗浄空の値
空の値を入力
fillna
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
パラメータ
  • value : scalar, dict, Series, or DataFrame
  • method:{‘backfill’,‘bfill’,‘pad’,‘ffill’,None},default None(bfillは後の値で埋め込まれ、ffillは逆)
  • axis : {0 or ‘index’, 1 or ‘columns’}
  • inplace : boolean, default False
  • limit : int, default None
  • downcast : dict, default is None

  • 戻り値
  • filled : DataFrame

  • Interpolation
    replace
    NULL行または列の削除
    DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
    パラメータ
  • axis : {0 or ‘index’, 1 or ‘columns’}, or tuple/list thereof
  • how : {‘any’, ‘all’}
  • thresh : int, default None
  • subset : array-like
  • inplace : boolean, default False

  • 戻る
  • dropped:DataFrame参考文献:http://python.jobbole.com/87266/http://pandas.pydata.org/pandas-docs/stable/missing_data.html None Nan