二次モーメントに関する話
はじめに
おなじみの概念だが,少し離れるとちょっと忘れてしまうので,その備忘録.
二次モーメントとは
モーメント
関数 $f:X\subset\mathbb{R}\rightarrow \mathbb{R}$ の $c$ 周りの $p$ 次 モーメント $\mu_{p}^{(c)}$ は,
\mu_{p}^{(c)} := \int_X (x-c)^pf(x)\mathrm{d}x
で定義される.$f$ が密度関数なら $M:=\mu_0$ は質量,$\mu:=\mu_1^{(0)}/M$ は重心であり,確率密度関数なら $M=1$ で,$\mu$ は期待値,$\sigma^2=\mu_2^{(\mu)}$ は分散である.二次モーメントとは,この $p=2$ のモーメントのことである.
離散系の場合も,$f$ が デルタ関数 の線形和であると考えれば良い.
応用
確率論における 分散 や 最小二乗法 における二乗誤差の他,慣性モーメント や 断面二次モーメント といった,機械工学面での応用もあり,重要な概念の一つである.
性質
二次モーメントには,次のような面白い性質がある.(以下,積分範囲は省略する)
\begin{align}
\mu_2^{(c)} &= \int (x-c)^2f(x)\mathrm{d}x \\
&= \int (x^2-2cx+c^2)f(x)\mathrm{d}x \\
&= \int x^2f(x)\mathrm{d}x-2c\int xf(x)\mathrm{d}x+c^2\int f(x)\mathrm{d} x \\
&= \mu_2^{(0)}-\mu^2M+(c-\mu)^2 M \\
&= \int \left(x^2-2\left(\mu_1^{(0)}/M\right)x+\left(\mu_1^{(0)}\right)^2/M\right)f(x) \mathrm{d}x+(\mu-c)^2M \\
&= \mu_2^{(\mu)}+\int (x-c)^2\big(M\delta(x-\mu)\big)\mathrm{d}x
\end{align}
つまり,重心 $\mu$ 周りの二次モーメントと,質量が重心1点に集中 ($f(x)=M\delta(x-\mu)$) したときの $c$ 周りの二次モーメントの和になり,($0<M$ なら) $c=\mu$ のとき最小になることがわかる.
$c=\mu$ のとき最小になるという性質は,統計において1点で代表するときに平均を使うのは,平均二乗誤差を最小にする代表値である1ということや,空中で物を回転させると重心を通る軸の周りで回転することなどの理由になっている.
分散の逐次計算とか
この性質から,(標本)分散の逐次計算などに応用できる.
(標本)平均については,$(x_1,x_2,\ldots,x_n)$ の平均
m_n := \dfrac{1}{n}\sum_{i=1}^{n} x_i
がわかっているなら,$x_i$ をすべて保存していなくても,
m_{n+1} = \dfrac{nm_n+x_{n+1}}{n+1}
のように逐次計算できることがよく知られているが,分散についても同様に,
\begin{align}
\sigma_n^2 &:= \dfrac{1}{n}\sum_{i=1}^n (x_i-m_n)^2 \\
\sigma_{n+1}^2\! &\ = \dfrac{n\sigma_n^2}{n+1}+\dfrac{n(m_n-m_{n+1})^2+(x_{n+1}-m_{n+1})^2}{n+1} \\
&\ = \dfrac{n\sigma_n^2}{n+1}+\dfrac{n(m_n-x_{n+1})^2}{(n+1)^2}
\end{align}
のように計算できる.
さらに言えば,濃度 $n$,平均 $m$,分散 $\sigma^2$ の多重集合を $(n,m,\sigma^2)$ と表すと,2つの多重集合の結合は,
(n_0,m_0,\sigma_0^2)\uplus(n_1,m_1,\sigma_1^2)=\left(n_0+n_1,\dfrac{n_0m_0+n_1m_1}{n_0+n_1},\dfrac{n_0\sigma_0^2+n_1\sigma_1^2}{n_0+n_1}+\dfrac{n_0n_1(m_0-m_1)^2}{(n_0+n_1)^2}\right)
のように書ける.$(n,m_n,\sigma_n^2)\uplus(1,x_{n+1},0)$ をこれに代入すると,上記の式に一致することがわかる.
また,これは連続体における二次モーメントの性質として,次のように記述できる($\sigma^2\rightarrow\mu_2=M\sigma^2$に変えている点に注意).
(M,\mu,\mu_2)\uplus(M',\mu',\mu_2')=\left(M+M',\dfrac{M\mu+M'\mu'}{M+M'},\dfrac{M\mu_2+M'\mu_2'+MM'(\mu-\mu')^2}{M+M'}\right)
不偏分散の分散の推定
話は変わるが,不偏分散の分散の推定について以前考察したことがあるので,リンクだけ貼っておく.
-
逆に言えば,平均でものを見るというのは,二乗誤差を気にするということであり,中央値でものを見るというのは,絶対値誤差を気にするということである,と言える. ↩
Author And Source
この問題について(二次モーメントに関する話), 我々は、より多くの情報をここで見つけました https://qiita.com/cycloawaodorin/items/60de7f4b668fa159fbe2著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .