統計検定凖1級の勉強をする話⑤~離散型分布~

はてさて、今回から確率分布の各論ということで、離散型分布を見ていきます。

半分くらいは2級からの復習ですが、もうあんまり覚えていません。

離散一様分布
ベルヌーイ分布
二項分布
1. ルーレットで勝ちたいその1
超幾何分布
ポアソン分布
幾何分布
1. ルーレットで勝ちたいその2
負の二項分布(パスカル分布)
多項分布
まとめ

離散一様分布

サイコロとかですね、確率変数Xが値1,2,3,…kを等確率で取るXの分布です。

つまり、

$$P(X=1)=P(X=2)=…P(X=k) = \frac{1}{k}$$

ということです。

この場合の期待値と分散は

$$E[X]=\frac{k+1}{2}$$

$$V[X]=\frac{k^2-1}{12}$$

サイコロの場合はk=6なので、E[X]＝3.5 V[X]=2.9となる

ベルヌーイ分布

例としてはコインを1回投げるとかですね。

成功と失敗の２つの結果が起きる試行について、成功する確率が$0 \leq p \leq 1$の時、

成功確率pのベルヌーイ試行という。

ここでベルヌーイ試行によって成功であれば１、失敗で０という値を取る確率変数Xを考えると、

このXはベルヌーイ分布$Bin(1, p)$に従うという。

この確率関数は

$$P(X = k) = p^k (1 – p)^{1-k}, \quad k \in {0, 1}, \quad 0 \leq p \leq 1$$

で、期待値と分散は

$$E[X]=p$$

$$V[X]=p(1-p)$$

となる。

二項分布

二項分布はコインをn回投げた時、

つまり互いに独立なベルヌーイ試行をn回繰り返した時の成功回数分布です。

二項分布$Bin(n,p)$の確率関数は

$$P(X = k) = \frac{n!}{k!(n-k)!} p^k (1 – p)^{n – k}, \quad k \in {0, 1, \dots, n}, \quad 0 \leq p \leq 1$$

またその期待値は

$$E[X]=np$$

$$V[X]=np(1-p)$$

n=10としてpを変動させた時の分布はこんな感じ。

ルーレットで勝ちたいその1

ここでふと、カジノのルーレットの赤か黒かって二項分布だよなぁと思った。

私はカジノに行ったのは大学生の時にオーストラリアでやった以来なので(しかもブラックジャックばっかりやってた)あまり詳しくはないが、

グーグル先生に調べてもらったところ、主流なものにはアメリカンスタイルとヨーロピアンスタイルなるものがあるらしい。

ルーレットの赤黒、ないし奇数偶数で絶対に勝てないのは0(緑)が存在するからだが、アメリカンスタイルでは0と00の二種類があるっぽいので勝率が高いヨーロピアンスタイルを選択することにする。

ヨーロピアンスタイルの数字は37字で、赤18+黒18+緑1のようである。

すなわち常に赤にかけ続けるとして、成功確率は18/37ということになる。

さて、特にカジノに詳しくもない私が知っている戦法はマーチンゲール法くらいなのだが、実際には資金が十分にないので破綻することが多い。

マーチンゲール法

マーチンゲール最も古典的かつ有名な手法で、カジノ必勝法として永らく愛されてきた。「倍賭け法」「倍々ゲーム」とも言われる。まず１単位を賭け、負ければその倍の２単位、さらに負ければそのさらに倍の４単位と賭けていき、一度でも勝てばそれまでの収支がプラスになり、また最初の１単位から同じことを繰り返すという手法である。試行回数に関係なく、勝った時には１単位を得ることになる。多くの場合には少額の勝ちであるが、負ける時は大敗する。ルーレットの赤黒のような二択のギャンブルは、片方だけが永遠に出続けることは絶対に無いので、配当が２倍以上のギャンブルで行えば、理論上は100％勝てる方法だが、実際に行った場合、負けが連続するとたちまち資金がパンクするか、もしくはテーブルリミット(賭け金の上限)に達してしまうため、実用的な方法とは言えない。

ベッティングシステム - Wikipedia
ja.wikipedia.org

bin(n, 18/37)としてX=0の場合、つまり負け続ける場合を考えると、

n=5の時点でP(X=0)=0.036なので、96%くらいの確率で5回以内に勝つと推測される。

ラスベガスのルーレットはミニマムベッド10ドルとのことなので、

5回目までに賭ける金額は

10+20+40+80+160=310ドル

5万くらいで一応成り立つ、、のか?(96%)

ただ、このループを繰り返すとなると、今度は１ループごとの成功、失敗としてBin(n, 0.04)を行うことになる。

10回繰り返すとして、それまでに負けない確率はn=10として

P(X=0)=0.66

んーもう必勝法じゃなくなってきました…

超幾何分布

赤と白が入った袋から玉を取り出す場合の分布。

なお、取り出したものは戻さない(非復元抽出)

戻す場合は二項分布に従う。

AとBからなるN個のものがあり、それぞれM個とN-M個あるとする。

今、この中からn個を取り出した時、その内訳がそれぞれx個とn-x個とする。

この時、xの取りうる値の確率関数は

$$P(X = x) = \frac{\frac{M!}{x!(M-x)!} \cdot \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}}$$

で、その期待値と分散は

$$E[X] = n \cdot \frac{M}{N}$$

$$V[X] = n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{N-n}{N-1}$$

となる。

ポアソン分布

不動産が契約まで到達できる確率など

nが大きく、pが小さい二項分布を考える。

np=λとなるように、n→♾️、p→0となる極限では、

各xについて、

$$P(X=x) =_n C_x P^x (1-p) → \frac{e^{-\lambda}\lambda^x}{x!}$$

が成り立つ。これをポアソンの少数の法則といい、この確率関数に従う分布をポアソン分布という。

この時、期待値と分散は

$$E[X]=V[X]=\lambda$$

なお、λにはデータの平均が採用される。

幾何分布

これはあれですね、ガチャで何回回したらレアなやつが出るかみたいなやつ。

ベルヌーイ試行を繰り返した時に、最初の成功が出現するまでの試行回数をxとした時、

その確率関数は

$$f(x)=p(1-p)^{x-1}$$

で与えられ、この分布を幾何分布という。

そしてその期待値と分散は、

$$E[x] = \frac{1}{p}$$

$$V[x]=\frac{1-p}{p^2}$$

である

ルーレットで勝ちたいその2

よく考えたらさっき考えたルーレットの話、幾何分布の方で考えると勝つまでの回数の期待値がわかるのでは？

つまり、マーチンゲール法で赤か黒どちらか一方にかけ続けたとき、初めて勝つ(つまり賭けをやめる)までの回数nの期待値は37/11=3.4回

ということは平均3〜4回目で勝てると。

そう思うとやっぱり5回目で負けたら今日は運がなかったと思って5万失って撤退するのがいいのかもしれない。。。

あと、この方法の最大の欠点は、どのタイミングで勝っても1ループあたり初期ベット分の10ドルしか勝てない、ということである。

96%で10ドル儲かるけど4％で300ドル持ってかれる賭け。。

5万が10万になるには30回勝たないといけなくて、確率は0.96の30乗で30％くらい。

しょっぱいね。。。

負の二項分布(パスカル分布)

幾何分布を一般化した形。

k回目の成功を得るための失敗回数をxとした時、その確率関数は

確率質量関数（PMF）：
$$P(X = x) = \frac{(x + k – 1)!}{(k – 1)! \, x!} p^k (1 – p)^x$$

期待値：
$$E[X] = \frac{k(1 – p)}{p}$$

分散：
$$\text{Var}(X) = \frac{k(1 – p)}{p^2}$$

多項分布

複数の結果1,2,…..,Kのいずれかが起こる試行を考える。

それぞれの結果が起こる確率がp1, p2, ……,pkとするとき、この試行をn回行い、

結果jが起こる回数をYjとする。この時Y = Y1, Y2,….Ykが従う分布を多項分布といい、

その確率関数は

$$P(X_1 = x_1, X_2 = x_2, \dots, X_k = x_k) = \frac{n!}{x_1! x_2! \dots x_k!} p_1^{x_1} p_2^{x_2} \dots p_k^{x_k}$$

期待値と分散、共分散は

$$E[X_i] = n p_i$$

$$\text{Var}(X_i) = n p_i (1 – p_i)$$

$$\text{Cov}(X_i, X_j) = -n p_i p_j$$

となる

まとめ

カジノは負け戦。

今回は以上です！