2024年5月26日

確率とは(Probability Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


「コインを投げて表が出る確率は2分の1」とか「サイコロを振って3が出る確率は6分の1」くらいが私たちの多くにとっての確率です。それで「確率なんて簡単!、高校でもちょっとやったし」と思いがちです。

ただ、数学的には、これまで書いてきた集合論、測度論、そのほかたくさんの土台となる知識があってはじめて論じられる話題のようです。その意味では、現段階でこのトピックを取り扱うのは無謀極まりないのですが、文系による個人ブログということで大目にみていただければ幸いです。(文系を免罪符にしてはいけませんが…)


*  *  *


ラプラスの確率
「10回くじを引けば1回当たりが出る」とか「2回コイントスをすれば1回表が出る」というのは、同様に確からしい試行を繰り返して何回成功するかというある種の相対頻度です。

数学者・天文学者のラプラス(Pierre-Simon Laplace:1749-1827)は確率というものをおおよそこのように考えました。素朴とも言えますが私たちの多くにとって自然に感じられる考え方です。

参考資料


未解明の生起メカニズムをブラックボックスとして、その結果だけを問題にすると、偶然の要素が作用したようにみえます。その作用を相対頻度で数値化したものが古典的な意味での確率です。

ラプラスが生きた18世紀の中頃から19世紀のはじめは近代科学の黎明期でした。当時は、各学問領域に仮置きされているブラックボックスの中身が解明されれば確率の意義は薄れてゆくと考えられていました。そうした科学にとって希望に満ちた時代を象徴するのがラプラスの悪魔という言葉です。

ラプラスが『確率の解析的理論』の中に書き記したことに尾ひれがついてひろまったこの言葉の意味は、すべてのブラックボックスが解明されれば、確率的にみえることが実は確定的であることがわかり、世界の全てがわかるはずだということです。

面白いことに、科学が発展して起きたのは、確率の意味が薄れることではなく、確率の意義が高まることでした。高まる意義に応えるべく確率概念を定式化したのがコルモゴロフ(1903-1987)です。


コルモゴロフの確率
コルモゴロフが定式化した確率論は、数学的な道具で記述されます。皮肉なことに、これが私たちを確率論から遠ざけることにもなりました。確率論のテキストのはじめに$(\Omega, \mathcal{F}, P)$という表記が登場します。この記号を見た大半の人は、「確率論は難しすぎる」と学びをやめてしまいます。私も長らくこれが何かわかりませんでした。現時点での理解ですが、$(\Omega, \mathcal{F}, P)$はおおよそ次のような意味を持つようです。

$\Omega$:「オメガ」と読むこれは、起こりうるすべてのことを集めたものです。たとえば、コイントスをすると表か裏が出ます。「表が出る」とか「裏が出る」ということは、それ以上細かく場合分けできません。そうしたものを根元事象(elementary event)標本(sample)といいます。そして、根元事象をすべて集めたものを全事象(sure event)といいます。

$\mathcal{F}$:これは加法族といわれるものです。加法族とは、$\Omega$をベースにした全事象、余事象、和事象を含む集合の集まりのことです。コイントスの例を用いると、全事象とは

$$\Omega=\{表, 裏\}$$

です。余事象とはではないほうのことです。たとえば、全事象$\Omega$の余事象は

$$\Omega^c=\varnothing$$

です。$\Omega$の右上にある$c$は、余事象(complementary event)を表すマークです。$\varnothing$は空集合です。コイントスをして表か裏が出ることを全事象としたとき、その余事象はコイントスをして表も裏も出ない、つまり何も起きないということです。何も起きないことを記号$\varnothing$で表します。同様に、「表が出る」の余事象は「裏が出る」であり、「裏が出る」の余事象は「表が出る」です。

和事象とは、2つ以上の根元事象のいずれかが起きることを意味します。「表が出る」と「裏が出る」という2つの根元事象の和は

$$表\cup 裏$$

と表記します。$\cup$は事象の和を表します。全事象、余事象、和事象すべてを含む集合の集まりは

$$\{\Omega, \varnothing, 表, 裏, \{表, 裏\}\}$$

この例では$\Omega= \{表, 裏\}$ですので、これを$\Omega$で代表させると

$$\mathcal{F}=\{\Omega, \varnothing, 表, 裏\}$$

$\mathcal{F}$の要素は4つです。要素が有限個であることから、これを有限加法族といいます。一般に、有限加法族の要素の数は2の根元事象乗($2^{\Omega}$)だけあります。この例では根元事象は2つですので、有限加法族の要素の数は$2^2=4$個です。

$P$:これは$\mathcal{F}$の要素すべてに付される確率を意味します。すべての事象に付けられた値だと考えてください。コイントスの例では

$$P(\Omega)=1, P(\varnothing)=0, P(表)=\frac{1}{2}, P(裏)=\frac{1}{2}$$

全事象$\Omega$の確率を1とすると、それ以外の事象の確率を直感的に掴みやすくなります。全体を1(100%)とすることで、確率20%とか60%とか、わかりやすく確率を評価できます。何かが起こる確率が100%なのであれば、何も起きない確率は0です。これが$P(\varnothing)=0$という表記です。

また、根元事象は互いに素ですので、根元事象の和事象の確率は各根元事象の確率の和に等しくなります。ここに加法族の加法の意味があります。すなわち

$$P(表\cup 裏)=P(表)+P(裏)=\frac{1}{2}+\frac{1}{2}$$

すべての根元事象の和事象の確率は1になります。この例の根元事象は「表が出る」と「裏が出る」の2つですので、これら2つの和事象の確率は1になります。確認のために式を書くと

$$P(表\cup 裏)=P(\Omega)=1$$

私たちが日常使う「確率」という言葉を、数学ではここまで細かく定義します。また少しずつ確率のはなしを書いてゆければと思います。