はてさて、今回から確率分布の各論ということで、離散型分布を見ていきます。
半分くらいは2級からの復習ですが、もうあんまり覚えていません。
離散一様分布
サイコロとかですね、確率変数Xが値1,2,3,…kを等確率で取るXの分布です。
つまり、
$$P(X=1)=P(X=2)=…P(X=k) = \frac{1}{k}$$
ということです。
この場合の期待値と分散は
$$E[X]=\frac{k+1}{2}$$
$$V[X]=\frac{k^2-1}{12}$$
サイコロの場合はk=6なので、E[X]=3.5 V[X]=2.9となる
ベルヌーイ分布
例としてはコインを1回投げるとかですね。
成功と失敗の2つの結果が起きる試行について、成功する確率が\(0 \leq p \leq 1\)の時、
成功確率pのベルヌーイ試行という。
ここでベルヌーイ試行によって成功であれば1、失敗で0という値を取る確率変数Xを考えると、
このXはベルヌーイ分布\(Bin(1, p)\)に従うという。
この確率関数は
$$P(X = k) = p^k (1 – p)^{1-k}, \quad k \in {0, 1}, \quad 0 \leq p \leq 1$$
で、期待値と分散は
$$E[X]=p$$
$$V[X]=p(1-p)$$
となる。
二項分布
二項分布はコインをn回投げた時、
つまり互いに独立なベルヌーイ試行をn回繰り返した時の成功回数分布です。
二項分布\(Bin(n,p)\)の確率関数は
$$P(X = k) = \frac{n!}{k!(n-k)!} p^k (1 – p)^{n – k}, \quad k \in {0, 1, \dots, n}, \quad 0 \leq p \leq 1$$
またその期待値は
$$E[X]=np$$
$$V[X]=np(1-p)$$
n=10としてpを変動させた時の分布はこんな感じ。

ルーレットで勝ちたい その1
ここでふと、カジノのルーレットの赤か黒かって二項分布だよなぁと思った。
私はカジノに行ったのは大学生の時にオーストラリアでやった以来なので(しかもブラックジャックばっかりやってた)あまり詳しくはないが、
グーグル先生に調べてもらったところ、主流なものにはアメリカンスタイルとヨーロピアンスタイルなるものがあるらしい。
ルーレットの赤黒、ないし奇数偶数で絶対に勝てないのは0(緑)が存在するからだが、アメリカンスタイルでは0と00の二種類があるっぽいので勝率が高いヨーロピアンスタイルを選択することにする。
ヨーロピアンスタイルの数字は37字で、赤18+黒18+緑1のようである。
すなわち常に赤にかけ続けるとして、成功確率は18/37ということになる。
さて、特にカジノに詳しくもない私が知っている戦法はマーチンゲール法くらいなのだが、実際には資金が十分にないので破綻することが多い。
マーチンゲール 最も古典的かつ有名な手法で、カジノ必勝法として永らく愛されてきた。「倍賭け法」「倍々ゲーム」とも言われる。 まず1単位を賭け、負ければその倍の2単位、さらに負ければそのさらに倍の4単位と賭けていき、一度でも勝てばそれまでの収支がプラスになり、また最初の1単位から同じことを繰り返すという手法である。試行回数に関係なく、勝った時には1単位を得ることになる。 多くの場合には少額の勝ちであるが、負ける時は大敗する。 ルーレットの赤黒のような二択のギャンブルは、片方だけが永遠に出続けることは絶対に無いので、配当が2倍以上のギャンブルで行えば、理論上は100%勝てる方法だが、実際に行った場合、負けが連続するとたちまち資金がパンクするか、もしくはテーブルリミット(賭け金の上限)に達してしまうため、実用的な方法とは言えない。
ベッティングシステム - Wikipedia
bin(n, 18/37)としてX=0の場合、つまり負け続ける場合を考えると、
n=5の時点でP(X=0)=0.036なので、96%くらいの確率で5回以内に勝つと推測される。
ラスベガスのルーレットはミニマムベッド10ドルとのことなので、
5回目までに賭ける金額は
10+20+40+80+160=310ドル
5万くらいで一応成り立つ、、のか?(96%)
ただ、このループを繰り返すとなると、今度は1ループごとの成功、失敗としてBin(n, 0.04)を行うことになる。
10回繰り返すとして、それまでに負けない確率はn=10として
P(X=0)=0.66
んーもう必勝法じゃなくなってきました…
超幾何分布
赤と白が入った袋から玉を取り出す場合の分布。
なお、取り出したものは戻さない(非復元抽出)
戻す場合は二項分布に従う。
AとBからなるN個のものがあり、それぞれM個とN-M個あるとする。
今、この中からn個を取り出した時、その内訳がそれぞれx個とn-x個とする。
この時、xの取りうる値の確率関数は
$$P(X = x) = \frac{\frac{M!}{x!(M-x)!} \cdot \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}}$$
で、その期待値と分散は
$$E[X] = n \cdot \frac{M}{N}$$
$$V[X] = n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{N-n}{N-1}$$
となる。
ポアソン分布
不動産が契約まで到達できる確率など
nが大きく、pが小さい二項分布を考える。
np=λとなるように、n→♾️、p→0となる極限では、
各xについて、
$$P(X=x) =_n C_x P^x (1-p) → \frac{e^{-\lambda}\lambda^x}{x!}$$
が成り立つ。これをポアソンの少数の法則といい、この確率関数に従う分布をポアソン分布という。
この時、期待値と分散は
$$E[X]=V[X]=\lambda$$
なお、λにはデータの平均が採用される。
幾何分布
これはあれですね、ガチャで何回回したらレアなやつが出るかみたいなやつ。
ベルヌーイ試行を繰り返した時に、最初の成功が出現するまでの試行回数をxとした時、
その確率関数は
$$f(x)=p(1-p)^{x-1}$$
で与えられ、この分布を幾何分布という。
そしてその期待値と分散は、
$$E[x] = \frac{1}{p}$$
$$V[x]=\frac{1-p}{p^2}$$
である
ルーレットで勝ちたい その2
よく考えたらさっき考えたルーレットの話、幾何分布の方で考えると勝つまでの回数の期待値がわかるのでは?
つまり、マーチンゲール法で赤か黒どちらか一方にかけ続けたとき、初めて勝つ(つまり賭けをやめる)までの回数nの期待値は37/11=3.4回
ということは平均3〜4回目で勝てると。
そう思うとやっぱり5回目で負けたら今日は運がなかったと思って5万失って撤退するのがいいのかもしれない。。。
あと、この方法の最大の欠点は、どのタイミングで勝っても1ループあたり初期ベット分の10ドルしか勝てない、ということである。
96%で10ドル儲かるけど4%で300ドル持ってかれる賭け。。
5万が10万になるには30回勝たないといけなくて、確率は0.96の30乗で30%くらい。
しょっぱいね。。。
負の二項分布(パスカル分布)
幾何分布を一般化した形。
k回目の成功を得るための失敗回数をxとした時、その確率関数は
確率質量関数(PMF):
$$P(X = x) = \frac{(x + k – 1)!}{(k – 1)! \, x!} p^k (1 – p)^x$$
期待値:
$$E[X] = \frac{k(1 – p)}{p}$$
分散:
$$\text{Var}(X) = \frac{k(1 – p)}{p^2}$$
多項分布
複数の結果1,2,…..,Kのいずれかが起こる試行を考える。
それぞれの結果が起こる確率がp1, p2, ……,pkとするとき、この試行をn回行い、
結果jが起こる回数をYjとする。この時Y = Y1, Y2,….Ykが従う分布を多項分布といい、
その確率関数は
$$P(X_1 = x_1, X_2 = x_2, \dots, X_k = x_k) = \frac{n!}{x_1! x_2! \dots x_k!} p_1^{x_1} p_2^{x_2} \dots p_k^{x_k}$$
期待値と分散、共分散は
$$E[X_i] = n p_i$$
$$\text{Var}(X_i) = n p_i (1 – p_i)$$
$$\text{Cov}(X_i, X_j) = -n p_i p_j$$
となる
まとめ
カジノは負け戦。
今回は以上です!


コメント