EDA-累積分布関数(CDF: Cumulative Distribution Function)
累積分布関数(CDF: Cumulative Distribution Function)とは
確率変数Xがある値x以下(X <= x)の値となる確率です。
例えばサイコロを投げたときに「出る目が4以下となる確率」や「出る目が4から6の目が出る確率」といった、ある範囲の確率を求めるときに使用します。
確率質量関数(PMF: Probability Mass Function)との区別:
- PMFはある値xを得る確率
- CDFはある値x以下の値を得る確率
CDFプロット
import numpy as np
import seaborn as sns
pmf = df['col'].value_counts(normalize=True).sort_index()
cdf = np.cumsum(pmf)
fig, ax = plt.subplots()
ax.plot(pmf.index, pmf.values, label='PMF')
ax.plot(cdf.index, cdf.values, label='CDF')
ax.legend()
plt.show()
Author And Source
この問題について(EDA-累積分布関数(CDF: Cumulative Distribution Function)), 我々は、より多くの情報をここで見つけました https://qiita.com/fastso/items/982220edbc073a308cd0著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .