頭の整理

頭の中を整えるために,色々と書き綴ります

二項分布による確率の推定に必要な試行回数について

確率  { \displaystyle p } で起こる事象  { \displaystyle A } が, { \displaystyle n } 回の独立試行の結果  { \displaystyle r } 回起こるとします.このとき, { \displaystyle r } は確率変数であり,その確率分布は二項分布  { \displaystyle B \left( n, p \right) } と呼ばれ,次式で表されます.

 { \displaystyle B \left( n, p \right) =\left( \prod_{i = 1}^{r} \frac{n + 1 - i}{i} \right) p^r \left( 1 - p \right) ^{n-r} \ \ \ \ \ \left( r = 0,1, \ldots , n \right) }

ここで, { \displaystyle \epsilon } を正の定数として,次の不等式を考えます.

 { \displaystyle - \epsilon \leq \frac{r}{n} - p \leq \epsilon \ \ \ \ldots (1) }

上の不等式を  { \displaystyle r } について解くと,次式になります.

 { \displaystyle n \left( p - \epsilon \right) \leq r \leq n \left( p + \epsilon \right) }

そこで,

 { \displaystyle k = \lceil n \left( p - \epsilon \right) \rceil }

 { \displaystyle l = \lfloor n \left( p + \epsilon \right) \rfloor }

とおき,

 { \displaystyle S = \sum_{r=k}^{l} \left( \prod_{i = 1}^{r} \frac{n + 1 - i}{i} \right) p^r \left( 1 - p \right) ^{n-r} }

とすると, { \displaystyle S } { \displaystyle n } 回の独立試行を行ったときに  { \displaystyle (1) } の不等式が成り立つ確率になります.

 { \displaystyle \epsilon = 0.01 } として,異なる  { \displaystyle n } { \displaystyle p } について  { \displaystyle S } の値を求めた結果が次表になります.

f:id:todayf0rmu1a:20190914004115p:plain

 表を見ると, { \displaystyle n=10000 } では,上にあげた確率  { \displaystyle p } についてはいずれも  { \displaystyle S \geq 0.95 } となっています.

よって,上にあげた  { \displaystyle p } については,1万回の独立試行を行えば95%以上の確率で, { \displaystyle p } を誤差±1%以内で推定することができ,個人的にはこれで十分なのではないかと思います.

 

 

「Amazon.co.jpアソシエイト」