平均偏差を最小化するのは平均値ではなく中央値


次の平均偏差$\mu$を最小化する$m$の条件を調べます。
計算は初等的な物理数学レベルです。
$$
\mu=\frac{1}{n}\sum_i\big|x_i-m\big|
$$

方針

方法としては
$$\frac{\partial \mu}{\partial m}=0$$
となる$m$の条件を探索することになります。
その前に下記の準備をしておきます。

ヘヴィサイドステップ

絶対値が入ると表現するのに使えます。定義は実数$x$に対しヘヴィサイドステップは

\begin{align}
H(x)=
\quad &0 \qquad \text{if} \quad x\leq 0 \\
&1 \qquad \text{if} \quad 0\leq x
\end{align}

で定義されます。これを使うと例えば
$$|x|=xH(x)-xH(-x)$$
のように書き換えられます。

ディラックのデルタ

デルタ関数は

\begin{align}
\delta(x)=
\quad &\infty \qquad \text{if} \quad x=0 \\
&0 \qquad \text{other} \quad x \neq 0
\end{align}

のように振る舞います(定義ではない)。
知られた性質として
$$
x\delta(x)=0,\quad \frac{H(x)}{dx}=\delta(x)
$$
があります(今回の計算で使います)。

計算に戻る

定数$n$を含めて、$n\frac{d\mu}{m}$を計算しましょう。すると、
$$n\frac{d\mu}{dm}
=\sum_i \bigg(
H(m-x_i)-H(x_i-m)
\bigg)
$$
となります。右辺は
($m-x_i\geq 0$をみたす$x_i$の個数)から($x_i-m\geq 0$をみたす$x_i$の個数)をひいたものとなります。これが0になるには、それぞれの個数が等しくなること、すなわち$m$が$x_i$の中央値であれば良いことがわかります。■

これは何の話かというと……

例えばここでやってる計算について、有限個バージョンを作ったようなものです。

蛇足

今更iPadOSのパブリックベータが出ていたことを思い出し、導入したところ大変軽快だったため、動作環境テストを兼ねてこの記事を書いています。内容はgoodnoteに残っていたメモからそれらしいネタを抜き出してそのまま記事にしてしまいました……

(iPadのスクショ、上記計算で端折った部分はここの手計算部分で確認できます)