【確率論】確率は関数として考えるべき。

確率は"関数として"考えるべき 数学

今までの”確率”の考え方

「確率は関数として考えるべき」というタイトルを見て、「何言ってんだこいつ」となるのは次の理由からだろう。すなわち、確率というものは以下の公式で計算されるものであると習ったからである。

\( \frac{事象Aの起こる場合の数}{全ての場合の数} \)

以下具体例。

具体例1

Q. サイコロを1つ、1回だけ投げて、3の目が出る確率は?

A. \( \frac{1}{6} \) ※約17%
※サイコロ
を投げて出る目の数は 1, 2, 3, 4, 5, 6 の6つであり、”3の目が出る”という出来事(事象)はその中の1つである

もう1つ具体例(以下)。

具体例2

Q. ある程度の高さからボールを落として、地面にある9つの穴のどの穴にボールが入るのかを確かめる。このとき、真ん中の穴にボールが入る確率は?(ボールは必ずどれかの穴に入るものとし、かなりの高さからボールを落とすので、ボールは全ての穴に同じ確率で入るものとする。つまり、起こりうる結果のどれが起こる可能性もすべて同じである(”同様に確からしい”))
※イメージは以下

A. \( \frac{1}{9} \) 約11%

上記、具体例1と2は計算結果に特に疑問を挟む余地はないと思う。
では、次の具体例3はどうだろうか?

具体例3

Q. ある程度の高さからボールを落として、地面にある無限個の穴のどの穴にボールが入るのかを確かめる。このとき、真ん中の穴にボールが入る確率は?(ボールは必ずどれかの穴に入るものとし、かなりの高さからボールを落とすので、ボールは全ての穴に同じ確率で入るものとする)
※イメージは以下

A. \( \frac{1}{\infty} \)

答えは \( \frac{1}{\infty} \) となったが、果たしてこれは何%くらいの確率なんだろうか?
答えを言うと、0%である。

なぜなら、分数というものは分母が大きくなるにつれ、分数そのものの値が小さくなっていくからである。(以下例)

\( \frac{1}{2} = 0.5, \ \frac{1}{3} = 0.33, \ \frac{1}{4} = 0.25, \ …, \frac{1}{10} = 0.1, \ … , \frac{1}{100} = 0.01, \ \)
\(\frac{1}{1000} = 0.001, \ …, \frac{1}{1000000} = 0.000001, \ …, \frac{1}{\infty} = 0\)

したがって、分母が無限(∞)であるというのは、すなわち0%なのである。

具体例2までは、◯%の確率で〜という形で答えを出せていたが、具体例3は0%ということで、これは言い換えると、「ボールを落としたときに、無限個ある穴のどの穴にもそのボールが入らない(どの穴にも入る確率が0%)」ということを述べている。
これは直感的におかしいと思えるだろう。

ではここで、関数の考え方を用いて確率を表現してみよう。

関数を用いた”確率”の考え方

関数についての考え方はこちら↓の記事で紹介している通り、

関数とは、“入力”があって、その間に箱があり、そしてその入力に”出力”が対応しているものを指します。より詳細に言うと、入力に対し何らかの操作を箱の中で施し、その操作を施された入力を出力として返すものです。(以下、\(y = 2x \) という関数のイメージ。入力 \( x \) を 箱の中で2倍にし、その2倍した \( x \) を \( y\) として返している)

関数の考え方を確率に適用すると、例えば具体例1は以下のように表すことができる。
(3の目が出るという事象に対し、その事象の”起こりやすさ”を0以上1以下の値で付与するという操作を施し、その値を返している)

具体例2に関しても同様に、以下のように表すことができます。

このように、「入力に何らかの処理を施したものを出力として返す」という考え方を取り入れることで、 確率というものがただただ公式 \( \frac{事象Aの起こる場合の数}{全ての場合の数} \) にしたがって計算されるものである、という考え方を用いた際に生じる具体例3のような直感的に反する結果に対する反論を考えることができる。

よって、結論は「確率は関数として考えるべき」というものになる。

発展的な内容

ここからは、”確率論”と呼ばれる数学の一分野において使用される用語、標本空間、σ-field、確率測度の3点を紹介する。ゆえに、厳密な話を求めていない方は以降は読んで頂かなくても問題ない。

まずは、ここで使用される用語を整理する。(Wikipediaより参照。色々書いてあるが後程簡単に説明する)

  • 標本空間

標本空間(ひょうほんくうかん、英: sample space)は、確率論において、試行の結果全体の集合のことである。確率空間を定義する上で最初に必要な定義である。
標本空間はふつう \( \Omega \) で表す。

出典: フリー百科事典『ウィキペディア(Wikipedia)』
  • 完全加法族、可算加法族、σ-加法族、σ-集合代数、σ-集合体、σ-field

数学における完全加法族(かんぜんかほうぞく、英: completely additive class [of sets])、可算加法族(かさんかほうぞく、英: countably additive class [of sets])あるいは (σ-)加法族、σ-集合代数(シグマしゅうごうだいすう、英: σ-algebra [of subsets over a set])、σ-集合体(シグマしゅうごうたい、英: σ-field [of sets])は、主な用途として測度を定義することに十分な特定の性質を満たす集合の集まりである。特に測度が定義される集合全体を集めた集合族は完全加法族になる。この概念は、解析学ではルベーグ積分に対する基礎付けとして重要であり、また確率論では確率の定義できる事象全体の成す族として解釈される。

出典: フリー百科事典『ウィキペディア(Wikipedia)』

※注意:名前が多数あるが、筆者は σ-field という名前で習ったので、以降は σ-field で統一する

  • 確率測度

確率論における確率測度(かくりつそくど、英: probability measure)は、標本空間に事象となる完全加法族が与えられたとき、事象の確率を測る測度のことである。一般の測度の公理(完全加法性など)に加えて、標本空間の測度は 1 であることが公理に加わる。

出典: フリー百科事典『ウィキペディア(Wikipedia)』

ひとまず、”標本空間”と”σ-field”と”確率測度”だけを考えていただければ問題ない。
以下、それぞれについて簡単に説明する。

標本空間(\( \Omega \))

“標本空間”は、偶然起こる現象の結果の集まりであり、具体例1で言えば

  • 1の目が出る
  • 2の目が出る
  • 3の目が出る
  • 4の目が出る
  • 5の目が出る
  • 6の目が出る

というサイコロを1つ、1回だけ投げた際に生じた結果の集合だと思ってもらえれば良い。これは言い換えると、具体例1では、サイコロを振ってサイコロが割れる、サイコロが斜めに立つ、とかは考えないとしている。
※大体 \( \Omega \) で表される

σ-field(\( \mathcal{F} \))

σ-field”は、標本空間の中にある要素を用いた、人間が起こりやすさを考えたいとする対象を集めた集合である。分かりづらいので具体例1で考えると、具体例1におけるσ-fieldは、

  • 1の目が出る
  • 2の目が出る
  • 3の目が出る
  • 4の目が出る
  • 5の目が出る
  • 6の目が出る
  • 偶数の目が出る
  • 奇数の目が出る
  • 3以上の目が出る
  • 5以上の目が出る
  • 何かが出る

上記のようなものを集めた集合である。
つまりσ-fieldに何を含めるかは、起こりやすさを考えたいとする対象に何を含めるかという、その対象を設定するその人次第である。
※参考書によっては \( \mathcal{F} \) 以外で表されることがあるが、今回はこれで

確率測度(P)

“確率測度”は単に”確率”と呼んでもよい概念であり、前の章で取り上げた通り「関数」である。すなわち、何らかの偶然起こる現象の結果にその現象の”起こりやすさ”を付与、対応させるものである。
※大体 \( P \) で表される

ここまでの話をまとめると、

偶然起こる現象の結果の集まりである集合A(標本空間)の要素を用いて作成した、起こりやすさを考えたいとする対象を集めた集合B(σ-field)があり、その集合Bの中にある要素がそれぞれどれくらいの起こりやすさを保持しているのか(確率測度)を考える。(以下に具体例1を用いたイメージをいくつか作成。赤い矢印が確率測度

P(3の目が出る) = \( \frac{1}{6} \)
P(3以下の目が出る) = \( \frac{1}{2} \)

P(奇数の目が出る) = \( \frac{1}{2} \)
P(1 ~ 6のうちどれかの目が出る) = 1

※黒ポチは標本空間内の要素

補足として、標本空間(\( \Omega \))、σ-field(\( \mathcal{F} \))、確率測度(P)の3組をまとめた(\( \Omega \), \( \mathcal{F} \) , P)を確率空間と呼ぶ。また、P(\( \Omega \)) = 1 であり、これは標本空間全ての要素を入力とした確率測度は必ず1になるということを意味している。サイコロの例で言えば、「1~6のうちどれかが必ず出る」という確率は、1として定められていることを意味する。

タイトルとURLをコピーしました