ガウス関数の例として、確率密度関数がある。
これは、確率の分布を表す関数として使われる。
本記事では、ガウス関数を使った確率分布について説明する。
ガウス関数の正規化
最初にガウス関数の正規化を行う。
正規化とは、ガウス関数の積分の値を\(1\)にするように係数を決めることである。
2つのガウス関数\(f(x),f'(x)\)を考える。
ここで、\(f(x)\)は以下であるとする
\begin{eqnarray}
f(x)=Ae^{-\alpha x^2}
\end{eqnarray}
このとき、\(f(x)\)の積分を計算すると、以下になる。
\begin{eqnarray}
\int_{-\infty}^{\infty}f(x)dx=A\sqrt{\frac{\pi}{\alpha}}\tag{1}
\end{eqnarray}
次に、\(f'(x)\)の積分を考える。
ここで、\(f'(x)\)の積分の値は\(1\)にとなるような条件を、\(f'(x)\)は満たすとする。
つまり、
\begin{eqnarray}
\int_{-\infty}^{\infty}f'(x)dx=1\tag{2}
\end{eqnarray}
を満たすとする。
このとき、式1の両辺を\(A\sqrt{\frac{\pi}{\alpha}}\)で割ると以下になる。
\begin{eqnarray}
\int_{-\infty}^{\infty}\frac{1}{A}\sqrt{\frac{\alpha}{\pi}}f(x)dx=1\tag{3}
\end{eqnarray}
よって、式2,式3から、\(f'(x)\)は、以下のように計算できる。
\begin{eqnarray}
f'(x)&=&\frac{1}{A}\sqrt{\frac{\alpha}{\pi}}f(x)\\
&=&\frac{1}{A}\sqrt{\frac{\alpha}{\pi}}Ae^{-\alpha x^2}\\
&=&\sqrt{\frac{\alpha}{\pi}}e^{-\alpha x^2}
\end{eqnarray}
まとめると、\(f(x)\)を正規化した関数\(f'(x)\)は以下のようになる。
\begin{eqnarray}
f'(x)=\sqrt{\frac{\alpha}{\pi}}e^{-\alpha x^2}&&\\
\end{eqnarray}
確率密度関数
\(f'(x)\)の意味
つぎに、\(f'(x)\)の意味について考える。
改めて、ガウス関数の正規化の条件を確認する。
\begin{eqnarray}
\int_{-\infty}^{\infty}f'(x)dx=1\tag{4}
\end{eqnarray}
ここで、\(f'(x)dx\)に注目する。
式4の意味は、全ての\(x\)について\(f'(x)dx\)を足し合わせるという意味である。
そして、その足し合わせた結果が\(1\)である。
すると、\(f'(x)dx\)は\(x\)を得る確率であると考えることができる。
\(f'(x)\)をグラフにすると図1になる。
ここで、\(f'(x)\)の特徴は2つある。
- \(f'(x)\)は\(x=0\)で最大値を取る
- \(f'(x)=f'(-x)\)より、左右対称である
グラフの概形を決める分散
つぎに、グラフの概形はどのように決まるのかを考える。
改めて、\(f'(x)\)の形を確認する。
\begin{eqnarray}
f'(x)=\sqrt{\frac{\alpha}{\pi}}e^{-\alpha x^2}\tag{5}
\end{eqnarray}
ここで、\(\alpha=2\sigma\)とおく。
すると、\(f'(x)\)は以下のように書き換えられる。
\begin{eqnarray}
f'(x)=\sqrt{\frac{1}{2\pi{\sigma}^2}}e^{-\frac{x^2}{2{\sigma}^2}}
\end{eqnarray}
\({\sigma}^2\)を分散と呼ぶ。
この分散の大小によって、\(f'(x)\)の概形が変わる。
例えば、\({\sigma}^2=1\)と\({\sigma}^2\)のグラフを比べてみる。
図2を見ると、\(x=0\)の付近が極端に大きくなっている。
これは、\(x=0\)に近づくほど、\(x\)を得る確率が大きくなることを示している。
一方で、図3を見ると、\(x\)による\(x\)を得られる確率の変化は小さくなる。
実験誤差で例えると、\({\sigma}^2=1\)の\(f'(x)\)に従う実験結果は誤差が小さい。
しかし、\({\sigma}^2=100\)の\(f'(x)\)に従う実験結果は誤差が大きい。
平均値
最後に、平均値について考える。
平均値とは、その確率分布で最も得られる確率が高い値である。
式5では、\(x=0\)の時に最大値を得るので、平均値は\(0\)である。
では、平均値が\(0\)以外のときはどうなるのか。
これは、\(f'(x)\)を\(x\)方向に平行移動するだけである。
つまり、平均値が\(\mu\)のとき、\(f'(x)\)は以下のように書き換えられる。
\begin{eqnarray}
f'(x)=\sqrt{\frac{1}{2\pi{\sigma}^2}}e^{\frac{\left(x-\mu\right)^2}{2{\sigma}^2}}
\end{eqnarray}