Sei
X
1
,
X
2
,
X
3
,
⋯
{\displaystyle X_{1},X_{2},X_{3},\cdots }
eine Folge bernoulli-verteilter Zufallsvariablen und deren Summe
S
n
{\displaystyle S_{n}}
binomialverteilt mit Parametern
n
∈
N
{\displaystyle n\in \mathbb {N} }
,
p
∈
]
0
,
1
[
{\displaystyle p\in ]0,1[}
und
σ
2
=
p
(
1
−
p
)
{\displaystyle \sigma ^{2}=p(1-p)}
. Dann gilt:
(1)
P
(
S
n
=
k
)
=
B
(
k
∣
p
,
n
)
≈
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
{\displaystyle \quad \operatorname {P} \left(S_{n}=k\right)\;=\;B(k\mid p,n)\;\approx \;{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
(2)
lim
n
→
∞
P
(
x
1
≤
S
n
−
n
p
n
≤
x
2
)
=
1
2
π
σ
2
∫
x
1
x
2
exp
(
−
x
2
2
σ
2
)
d
x
{\displaystyle \quad \lim _{n\to \infty }\operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x}
für alle
x
1
,
x
2
∈
R
{\displaystyle x_{1},x_{2}\in \mathbb {R} }
mit
x
1
<
x
2
{\displaystyle x_{1}<x_{2}}
Nach Gauß lässt sich die Gammafunktion
Γ
(
x
)
{\displaystyle \Gamma (x)}
für alle
x
∈
C
∖
{
0
,
−
1
,
−
2
,
…
}
{\displaystyle x\in \mathbb {C} \setminus \{0,-1,-2,\dotsc \}}
und alle
n
∈
N
0
{\displaystyle n\in \mathbb {N} _{0}}
durch eine Produktdarstellung definieren
Γ
(
x
)
=
lim
n
→
∞
n
!
n
x
x
(
x
+
1
)
(
x
+
2
)
⋯
(
x
+
n
)
{\displaystyle \Gamma (x)=\lim _{n\to \infty }{\frac {n!\,n^{x}}{x(x+1)(x+2)\dotsm (x+n)}}}
.
Bemerkungen:
Es gilt
n
!
=
Γ
(
n
+
1
)
=
n
Γ
(
n
)
{\displaystyle n!=\Gamma (n+1)=n\Gamma (n)}
.
Die Stirlingformel lautet
n
!
=
lim
n
→
∞
(
2
π
n
(
n
e
)
n
+
ϵ
n
)
{\displaystyle n!=\lim _{n\to \infty }\left({\sqrt {2\pi n}}\;\left({\tfrac {n}{\mathrm {e} }}\right)^{n}+\epsilon _{n}\right)}
Nachfolgend wird das Näherungszeichen "
≈
{\displaystyle \approx }
" verwendet, wenn eine Approximation durchgeführt wird. Ein Gleichheitszeichen "
=
{\displaystyle =}
" wird gesetzt, wenn eine Umformung erfolgt.
In der Halbebene
Re
(
x
)
>
0
{\displaystyle \operatorname {Re} (x)>0}
gilt
log
Γ
(
x
)
=
(
x
−
1
2
)
log
x
−
x
+
log
2
π
+
O
(
1
|
x
|
)
{\displaystyle \log \Gamma (x)=(x-{\tfrac {1}{2}})\log x-x+\log {\sqrt {2\pi }}+{\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}}
.
Dabei ist
log
x
{\displaystyle \log x}
der Hauptzweig des Logarithmus (der reell ist für positive reelle
x
{\displaystyle x}
) und ebenso ist
log
Γ
(
x
)
{\displaystyle \log \Gamma (x)}
reell für positive reelle
x
>
0
{\displaystyle x>0}
.
Nach Gauß ist
Γ
(
x
)
=
lim
n
→
∞
n
!
n
x
x
(
x
+
1
)
(
x
+
2
)
⋯
(
x
+
n
)
{\displaystyle \Gamma (x)=\lim _{n\to \infty }{\frac {n!\,n^{x}}{x(x+1)(x+2)\dotsm (x+n)}}}
also
log
Γ
(
x
)
=
lim
n
→
∞
(
log
n
!
+
x
log
n
−
∑
k
=
0
n
log
(
x
+
k
)
)
{\displaystyle \log \Gamma (x)=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-\sum _{k=0}^{n}\log(x+k){\bigg )}}
Die Anwendung des Korollars ergibt für ein festes und beliebiges
x
{\displaystyle x}
mit
d
2
f
(
t
)
d
t
2
|
t
=
k
=
d
2
log
(
x
+
t
)
d
t
2
|
t
=
k
=
1
(
x
+
t
)
2
{\displaystyle {\bigg .}{\tfrac {\mathrm {d} ^{2}f(t)}{\mathrm {d} t^{2}}}{\bigg |}_{t=k}={\bigg .}{\tfrac {\mathrm {d} ^{2}\log(x+t)}{\mathrm {d} t^{2}}}{\bigg |}_{t=k}={\tfrac {1}{(x+t)^{2}}}}
und nach Umformung
∑
k
=
0
n
log
(
x
+
k
)
=
∫
0
n
log
(
x
+
t
)
d
t
+
1
2
(
log
x
+
log
(
x
+
n
)
)
+
∫
0
n
φ
(
t
)
1
(
x
+
t
)
2
d
t
{\displaystyle \sum _{k=0}^{n}\log(x+k)=\int _{0}^{n}\log(x+t)\mathrm {d} t+{\frac {1}{2}}{\bigg (}\log x+\log(x+n){\bigg )}\;+\;\int _{0}^{n}\varphi (t){\tfrac {1}{(x+t)^{2}}}\mathrm {d} t}
und somit
log
Γ
(
x
)
=
lim
n
→
∞
(
log
n
!
+
x
log
n
−
∫
0
n
log
(
x
+
t
)
d
t
−
1
2
(
log
x
+
log
(
x
+
n
)
)
−
∫
0
n
φ
(
t
)
1
(
x
+
t
)
2
d
t
)
{\displaystyle \log \Gamma (x)=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-\int \limits _{0}^{n}\log(x+t)\mathrm {d} t-{\frac {1}{2}}{\Big (}\log x+\log(x+n){\Big )}-\int \limits _{0}^{n}\varphi (t){\frac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg )}}
Wegen
|
φ
(
t
)
|
≤
1
8
{\displaystyle {\big |}\varphi (t){\big |}\leq {\tfrac {1}{8}}}
ergibt sich
|
∫
0
n
φ
(
t
)
1
(
x
+
t
)
2
d
t
|
≤
1
8
|
∫
0
n
1
(
x
+
t
)
2
d
t
|
{\displaystyle {\bigg |}\int _{0}^{n}\varphi (t){\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}\leq {\tfrac {1}{8}}{\bigg |}\int _{0}^{n}{\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}}
und wegen
1
8
|
∫
0
n
1
(
x
+
t
)
2
d
t
|
=
1
8
|
[
−
1
x
+
t
]
0
n
|
=
1
8
|
−
1
x
+
n
−
−
1
x
|
=
1
8
|
−
x
−
n
+
x
−
x
(
x
+
n
)
|
=
1
8
|
1
x
(
x
n
+
1
)
|
≤
1
8
1
|
x
|
≈
O
(
1
|
x
|
)
{\displaystyle {\tfrac {1}{8}}{\bigg |}\int _{0}^{n}{\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}={\tfrac {1}{8}}{\bigg |}{\bigg [}{\tfrac {-1}{x+t}}{\bigg ]}_{0}^{n}{\bigg |}={\tfrac {1}{8}}{\bigg |}{\tfrac {-1}{x+n}}-{\tfrac {-1}{x}}{\bigg |}={\tfrac {1}{8}}{\bigg |}{\tfrac {-x-n+x}{-x(x+n)}}{\bigg |}={\tfrac {1}{8}}{\bigg |}{\tfrac {1}{x({\tfrac {x}{n}}+1)}}{\bigg |}\leq {\tfrac {1}{8}}{\tfrac {1}{|x|}}\approx {\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}}
ist die Näherung
|
∫
0
n
φ
(
t
)
1
(
x
+
t
)
2
d
t
|
≈
O
(
1
|
x
|
)
{\displaystyle {\bigg |}\int _{0}^{n}\varphi (t){\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}\approx {\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}}
zulässig. Unter Auslassung des Fehlerterms
O
(
1
|
x
|
)
{\displaystyle {\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}}
der Approximation folgt
log
Γ
(
x
)
=
lim
n
→
∞
(
log
n
!
+
x
log
n
−
∫
0
n
log
(
x
+
t
)
d
t
−
1
2
(
log
x
+
log
(
x
+
n
)
)
)
{\displaystyle \log \Gamma (x)=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-\int \limits _{0}^{n}\log(x+t)\mathrm {d} t-{\frac {1}{2}}{\Big (}\log x+\log(x+n){\Big )}{\bigg )}}
Partielle Integration liefert
∫
0
n
log
(
x
+
t
)
d
t
=
[
(
x
+
t
)
log
(
x
+
t
)
−
1
]
0
n
=
(
x
+
n
)
log
(
x
+
n
)
−
x
log
x
+
C
{\displaystyle \int _{0}^{n}\log(x+t)\mathrm {d} t={\Big [}(x+t)\log(x+t)-1{\Big ]}_{0}^{n}=(x+n)\log(x+n)-x\log x+C}
. Da die Integrationskonstante o.B.d.A. gewählt werden kann, sei
C
=
−
n
{\displaystyle C=-n}
und damit
log
Γ
(
x
)
=
lim
n
→
∞
(
log
n
!
+
x
log
n
−
(
x
+
n
)
log
(
x
+
n
)
+
x
log
x
+
n
−
1
2
(
log
x
+
log
(
x
+
n
)
)
)
=
lim
n
→
∞
(
log
n
!
+
x
log
n
−
(
x
+
n
+
1
2
)
log
(
x
+
n
)
+
(
x
−
1
2
)
log
x
+
n
)
{\displaystyle {\begin{aligned}\log \Gamma (x)&=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-{\Big (}x+n{\Big )}\log(x+n)+x\log x+n-{\frac {1}{2}}{\Big (}\log x+\log(x+n){\Big )}{\bigg )}\\&=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}\log(x+n)+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+n{\bigg )}\end{aligned}}}
Es wird ein indirekter Beweis mit der Stirling-Formel
n
!
=
lim
n
→
∞
(
2
π
n
(
n
e
)
n
+
ϵ
n
)
{\displaystyle n!=\lim _{n\to \infty }\left({\sqrt {2\pi n}}\;\left({\tfrac {n}{\mathrm {e} }}\right)^{n}+\epsilon _{n}\right)}
,
log
e
=
1
{\displaystyle \log e=1}
und
log
ϵ
n
=
ϵ
n
′
{\displaystyle \log \epsilon _{n}=\epsilon _{n}'}
durchgeführt, wobei
log
n
!
=
lim
n
→
∞
(
(
n
+
1
2
)
log
n
−
n
+
log
2
π
+
ϵ
n
′
)
{\displaystyle \log n!=\lim _{n\to \infty }\left((n+{\tfrac {1}{2}})\log n-n+\log {\sqrt {2\pi }}+\epsilon _{n}'\right)}
ist und damit
log
Γ
(
x
)
=
lim
n
→
∞
(
(
n
+
1
2
)
log
n
−
n
+
x
log
n
−
(
x
+
n
+
1
2
)
log
(
x
+
n
)
+
(
x
−
1
2
)
log
x
+
n
+
ϵ
n
′
)
+
log
2
π
=
lim
n
→
∞
(
(
x
+
n
+
1
2
)
log
n
−
(
x
+
n
+
1
2
)
log
(
x
+
n
)
+
ϵ
n
′
)
+
(
x
−
1
2
)
log
x
+
log
2
π
{\displaystyle {\begin{aligned}\log \Gamma (x)&=\lim _{n\to \infty }{\bigg (}{\Big (}n+{\frac {1}{2}}{\Big )}\log n-n+x\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}\log(x+n)+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+n+\epsilon _{n}'{\bigg )}+\log {\sqrt {2\pi }}\\&=\lim _{n\to \infty }{\bigg (}{\Big (}x+n+{\frac {1}{2}}{\Big )}\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}\log(x+n)+\epsilon _{n}'{\bigg )}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+\log {\sqrt {2\pi }}\end{aligned}}}
Nun ist
log
(
x
+
n
)
=
log
(
n
(
1
+
x
n
)
)
=
log
n
+
log
(
1
+
x
n
)
{\displaystyle \log(x+n)=\log(n(1+{\tfrac {x}{n}}))=\log n+\log(1+{\tfrac {x}{n}})}
und für festes
x
{\displaystyle x}
und grosses
n
{\displaystyle n}
gilt
log
(
1
+
x
n
)
≈
x
n
+
O
(
1
n
2
)
{\displaystyle \log(1+{\tfrac {x}{n}})\approx {\tfrac {x}{n}}+{\mathcal {O}}{\Big (}{\tfrac {1}{n^{2}}}{\Big )}}
. Unter Auslassung des Fehlerterms
O
(
1
n
2
)
{\displaystyle {\mathcal {O}}{\Big (}{\tfrac {1}{n^{2}}}{\Big )}}
erhalten wir mit
log
(
x
+
n
)
=
log
n
+
x
n
{\displaystyle \log(x+n)=\log n+{\tfrac {x}{n}}}
log
Γ
(
x
)
=
log
2
π
+
(
x
−
1
2
)
log
x
+
lim
n
→
∞
(
(
x
+
n
+
1
2
)
log
n
−
(
x
+
n
+
1
2
)
(
log
n
+
x
n
)
+
ϵ
n
′
)
=
log
2
π
+
(
x
−
1
2
)
log
x
+
lim
n
→
∞
(
−
x
n
(
x
+
n
+
1
2
)
+
ϵ
n
′
)
=
log
2
π
+
(
x
−
1
2
)
log
x
−
x
{\displaystyle {\begin{aligned}\log \Gamma (x)&=\log {\sqrt {2\pi }}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+\lim _{n\to \infty }{\bigg (}{\Big (}x+n+{\frac {1}{2}}{\Big )}\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}{\Big (}\log n+{\frac {x}{n}}{\Big )}+\epsilon _{n}'{\bigg )}\\&=\log {\sqrt {2\pi }}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+\lim _{n\to \infty }{\bigg (}-{\frac {x}{n}}(x+n+{\frac {1}{2}})+\epsilon _{n}'{\bigg )}\\&=\log {\sqrt {2\pi }}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x-x\end{aligned}}}
◻
{\displaystyle \Box }
An dieser Stelle sei erwähnt, dass diese Näherung für
x
≥
9
{\displaystyle x\geq 9}
mit einem relativen Fehler von kleiner als
1
%
{\displaystyle 1\%}
behaftet ist.
Für die weitere Beweisführung seien folgende Umformungen angegeben:
Γ
(
x
)
≈
2
π
x
(
x
−
1
2
)
e
−
x
{\displaystyle \Gamma (x)\approx {\sqrt {2\pi }}x^{{\Big (}x-{\frac {1}{2}}{\Big )}}e^{-x}}
und wegen
n
!
=
Γ
(
n
+
1
)
=
n
Γ
(
n
)
{\displaystyle n!=\Gamma (n+1)=n\Gamma (n)}
folgt
n
!
=
n
Γ
(
n
)
≈
n
2
π
n
(
n
−
1
2
)
e
−
n
=
2
π
n
(
n
e
)
n
=
n
n
e
−
n
2
π
n
{\displaystyle n!=n\Gamma (n)\approx n{\sqrt {2\pi }}n^{{\Big (}n-{\tfrac {1}{2}}{\Big )}}e^{-n}={\sqrt {2\pi n}}{\bigg (}{\frac {n}{e}}{\bigg )}^{n}=n^{n}e^{-n}{\sqrt {2\pi n}}}
Der Beweis wird in zwei Schritten durchgeführt.
Zunächst wird gezeigt:
B
(
k
∣
p
,
n
)
≈
n
n
e
−
n
2
π
n
k
k
e
−
k
2
π
k
(
n
−
k
)
n
−
k
e
−
(
n
−
k
)
2
π
(
n
−
k
)
p
k
(
1
−
p
)
n
−
k
{\displaystyle B(k\mid p,n)\approx {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}(1-p)^{n-k}}
Dazu werden mit Hilfe der Stirlingformel die Fakultäten ersetzt, also folgende Näherungen vorgenommen:
n
!
≈
2
π
n
(
n
e
)
n
=
n
n
e
−
n
2
π
n
{\displaystyle n!\approx {\sqrt {2\pi n}}\left({\frac {n}{e}}\right)^{n}=n^{n}e^{-n}{\sqrt {2\pi n}}}
k
!
≈
2
π
k
(
k
e
)
k
=
k
k
e
−
k
2
π
k
{\displaystyle k!\approx {\sqrt {2\pi k}}\left({\frac {k}{e}}\right)^{k}=k^{k}e^{-k}{\sqrt {2\pi k}}}
(
n
−
k
)
!
≈
2
π
(
n
−
k
)
(
n
−
k
e
)
n
−
k
=
(
n
−
k
)
n
−
k
e
−
(
n
−
k
)
2
π
(
n
−
k
)
{\displaystyle (n-k)!\approx {\sqrt {2\pi (n-k)}}\left({\frac {n-k}{e}}\right)^{n-k}=(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}
Damit lässt sich die Binomialverteilung wie folgt ausdrücken:
B
(
k
∣
p
,
n
)
=
(
n
k
)
p
k
(
1
−
p
)
n
−
k
=
n
!
k
!
(
n
−
k
)
!
p
k
(
1
−
p
)
n
−
k
≈
n
n
e
−
n
2
π
n
k
k
e
−
k
2
π
k
(
n
−
k
)
n
−
k
e
−
(
n
−
k
)
2
π
(
n
−
k
)
p
k
(
1
−
p
)
n
−
k
=
n
2
π
k
(
n
−
k
)
n
n
k
k
(
n
−
k
)
n
−
k
p
k
(
1
−
p
)
n
−
k
=
n
2
π
k
(
n
−
k
)
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
=
1
2
π
n
k
n
(
1
−
k
n
)
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
{\displaystyle {\begin{aligned}B(k\mid p,n)&={n \choose k}p^{k}(1-p)^{n-k}\\&={\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}\\&\approx {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}(1-p)^{n-k}\\&={\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}{\frac {n^{n}}{k^{k}\left(n-k\right)^{n-k}}}p^{k}(1-p)^{n-k}\\&={\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\\&={\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\end{aligned}}}
Mit der Näherung
k
n
≈
p
{\displaystyle {\frac {k}{n}}\approx p}
und der Taylorapproximation wird gezeigt:
B
(
k
∣
p
,
n
)
≈
1
2
π
n
k
n
(
1
−
k
n
)
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
≈
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
{\displaystyle B(k\mid p,n)\approx {\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\approx {\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
Für hinreichend großes
n
≫
k
{\displaystyle n\gg k}
kann die Näherung
k
n
≈
p
{\displaystyle {\frac {k}{n}}\approx p}
verwendet werden, woraus unmittelbar folgt
1
2
π
n
k
n
(
1
−
k
n
)
≈
1
2
π
n
p
(
1
−
p
)
=
1
2
π
n
σ
2
{\displaystyle {\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\approx {\frac {1}{\sqrt {2\pi np(1-p)}}}={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}}
.
Damit erhalten wir die gewünschte Darstellung und formen die beiden Potenzen in exponentielle Faktoren um, so dass:
B
(
k
∣
p
,
n
)
≈
1
2
π
n
σ
2
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
=
1
2
π
n
σ
2
(
p
k
/
n
)
k
(
(
1
−
p
)
1
−
k
/
n
)
n
−
k
=
1
2
π
n
σ
2
exp
(
n
n
log
(
(
p
k
/
n
)
k
(
1
−
p
1
−
k
/
n
)
n
−
k
)
)
=
1
2
π
n
σ
2
exp
(
n
n
log
(
(
k
/
n
p
)
−
k
(
1
−
k
/
n
1
−
p
)
−
(
n
−
k
)
)
)
=
1
2
π
n
σ
2
exp
(
n
(
−
k
n
log
(
k
/
n
p
)
⏟
f
(
x
)
−
(
1
−
k
n
)
log
(
1
−
k
/
n
1
−
p
)
⏟
g
(
x
)
)
)
{\displaystyle {\begin{aligned}B(k\mid p,n)&\approx {\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\left({\frac {p}{k/n}}\right)^{k}\left({\frac {(1-p)}{1-k/n}}\right)^{n-k}\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left({\frac {n}{n}}\log \left(\left({\frac {p}{k/n}}\right)^{k}\left({\frac {1-p}{1-k/n}}\right)^{n-k}\right)\right)\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left({\frac {n}{n}}\log \left(\left({\frac {k/n}{p}}\right)^{-k}\left({\frac {1-k/n}{1-p}}\right)^{-(n-k)}\right)\right)\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp {\Bigg (}n{\bigg (}-\underbrace {{\frac {k}{n}}\log \left({\frac {k/n}{p}}\right)} _{f(x)}-\underbrace {\left(1-{\frac {k}{n}}\right)\log \left({\frac {1-k/n}{1-p}}\right)} _{g(x)}{\bigg )}{\Bigg )}\end{aligned}}}
Um die Asymptotik der beiden exponentiellen Faktoren zu erhalten, bilden wir die Taylorapproximation in der Annäherung durch die Schmiegparabel . Wir erhalten mit
x
=
k
n
{\displaystyle x={\frac {k}{n}}}
für die Funktionen
f
(
x
)
=
x
ln
x
p
{\displaystyle f(x)=x\ln {\frac {x}{p}}}
und
g
(
x
)
=
(
1
−
x
)
ln
1
−
x
1
−
p
{\displaystyle g(x)=(1-x)\ln {\frac {1-x}{1-p}}}
, um den Entwicklungspunkt
x
=
p
{\displaystyle x=p}
, folgende Schmiegparabeln:
T
2
f
(
x
,
p
)
=
(
x
ln
x
p
)
|
x
=
p
+
d
d
x
(
x
ln
x
p
)
|
x
=
p
⋅
(
x
−
p
)
+
1
2
d
2
d
x
2
(
x
ln
x
p
)
|
x
=
p
⋅
(
x
−
p
)
2
=
(
ln
x
p
+
x
⋅
p
x
⋅
1
p
)
|
x
=
p
⋅
(
x
−
p
)
+
1
2
d
d
x
(
ln
x
p
+
1
)
|
x
=
p
⋅
(
x
−
p
)
2
=
x
−
p
+
1
2
(
p
x
⋅
1
p
)
|
x
=
p
⋅
(
x
−
p
)
2
=
x
−
p
+
1
2
p
⋅
(
x
−
p
)
2
{\displaystyle {\begin{aligned}T_{2}f(x,p)&=\left.\left(x\ln {\frac {x}{p}}\right)\right|_{x=p}+\left.{\frac {\mathrm {d} }{\mathrm {d} x}}\left(x\ln {\frac {x}{p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} ^{2}}{\mathrm {d} x^{2}}}\left(x\ln {\frac {x}{p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=\left.\left(\ln {\frac {x}{p}}+x\cdot {\frac {p}{x}}\cdot {\frac {1}{p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} }{\mathrm {d} x}}\left(\ln {\frac {x}{p}}+1\right)\right|_{x=p}\cdot (x-p)^{2}\\&=x-p+\left.{\frac {1}{2}}\left({\frac {p}{x}}\cdot {\frac {1}{p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=x-p+{\frac {1}{2p}}\cdot (x-p)^{2}\end{aligned}}}
und
T
2
g
(
x
,
p
)
=
(
(
1
−
x
)
ln
1
−
x
1
−
p
)
|
x
=
p
+
d
d
x
(
(
1
−
x
)
ln
1
−
x
1
−
p
)
|
x
=
p
⋅
(
x
−
p
)
+
1
2
d
2
d
x
2
(
(
1
−
x
)
ln
1
−
x
1
−
p
)
|
x
=
p
⋅
(
x
−
p
)
2
=
(
−
ln
1
−
x
1
−
p
+
(
1
−
x
)
⋅
1
−
p
1
−
x
⋅
−
1
1
−
p
)
|
x
=
p
⋅
(
x
−
p
)
+
1
2
d
d
x
(
−
ln
1
−
x
1
−
p
−
1
)
|
x
=
p
⋅
(
x
−
p
)
2
=
−
(
x
−
p
)
−
1
2
(
1
−
p
1
−
x
⋅
−
1
1
−
p
)
|
x
=
p
⋅
(
x
−
p
)
2
=
−
(
x
−
p
)
+
1
2
(
1
−
p
)
⋅
(
x
−
p
)
2
{\displaystyle {\begin{aligned}T_{2}g(x,p)&=\left.\left((1-x)\ln {\frac {1-x}{1-p}}\right)\right|_{x=p}+\left.{\frac {\mathrm {d} }{\mathrm {d} x}}\left((1-x)\ln {\frac {1-x}{1-p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} ^{2}}{\mathrm {d} x^{2}}}\left((1-x)\ln {\frac {1-x}{1-p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=\left.\left(-\ln {\frac {1-x}{1-p}}+(1-x)\cdot {\frac {1-p}{1-x}}\cdot {\frac {-1}{1-p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} }{\mathrm {d} x}}\left(-\ln {\frac {1-x}{1-p}}-1\right)\right|_{x=p}\cdot (x-p)^{2}\\&=-(x-p)-\left.{\frac {1}{2}}\left({\frac {1-p}{1-x}}\cdot {\frac {-1}{1-p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=-(x-p)+{\frac {1}{2(1-p)}}\cdot (x-p)^{2}\end{aligned}}}
Bemerkungen: zu beachten ist
d
d
x
ln
h
(
x
)
=
h
′
(
x
)
h
(
x
)
{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} x}}\ln h(x)={\frac {h'(x)}{h(x)}}}
und der Fehler dieser Näherung wird durch das Integralrestglied
R
2
f
(
x
,
p
)
{\displaystyle R_{2}f(x,p)}
bzw.
R
2
g
(
x
,
p
)
{\displaystyle R_{2}g(x,p)}
repräsentiert.
Die Zusammenfassung beider Taylorapproximationen liefert dann mit
σ
2
=
p
(
1
−
p
)
{\displaystyle \sigma ^{2}=p(1-p)}
und unter Auslassung der Restglieder:
T
2
f
(
x
,
p
)
+
T
2
g
(
x
,
p
)
=
x
−
p
+
1
2
p
⋅
(
x
−
p
)
2
−
(
x
−
p
)
+
1
2
(
1
−
p
)
⋅
(
x
−
p
)
2
=
1
2
p
⋅
(
x
−
p
)
2
+
1
2
(
1
−
p
)
⋅
(
x
−
p
)
2
=
1
−
p
+
p
2
p
(
1
−
p
)
⋅
(
x
−
p
)
2
=
1
2
p
(
1
−
p
)
⋅
(
x
−
p
)
2
=
1
2
σ
2
⋅
(
x
−
p
)
2
{\displaystyle {\begin{aligned}T_{2}f(x,p)+T_{2}g(x,p)&=x-p+{\frac {1}{2p}}\cdot (x-p)^{2}-(x-p)+{\frac {1}{2(1-p)}}\cdot (x-p)^{2}\\&={\frac {1}{2p}}\cdot (x-p)^{2}+{\frac {1}{2(1-p)}}\cdot (x-p)^{2}\\&={\frac {1-p+p}{2p(1-p)}}\cdot (x-p)^{2}\\&={\frac {1}{2p(1-p)}}\cdot (x-p)^{2}\\&={\frac {1}{2\sigma ^{2}}}\cdot (x-p)^{2}\end{aligned}}}
Insgesamt ergibt sich mit den unterschiedlichen Näherungen die Eingangs zitierte Aussage:
B
(
k
∣
p
,
n
)
≈
1
2
π
n
k
n
(
1
−
k
n
)
(
n
p
k
)
k
(
n
(
1
−
p
)
n
−
k
)
n
−
k
≈
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
{\displaystyle B(k\mid p,n)\approx {\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\;\approx \;{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
◻
{\displaystyle \Box }
Gezeigt wird, dass aus dem lokalen Grenzwertsatz im Limes
n
→
∞
{\displaystyle n\rightarrow \infty }
und der Riemann-Summe folgt:
P
(
x
1
≤
S
n
−
n
p
n
≤
x
2
)
=
1
2
π
σ
2
∫
x
1
x
2
exp
(
−
x
2
2
σ
2
)
d
x
{\displaystyle \operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x}
für alle
x
1
,
x
2
∈
R
{\displaystyle x_{1},x_{2}\in \mathbb {R} }
mit
x
1
<
x
2
{\displaystyle x_{1}<x_{2}}
Zunächst folgt mit dem lokalen Grenzwertsatz:
P
(
x
1
≤
S
n
−
n
p
n
≤
x
2
)
=
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
P
(
S
n
=
k
)
=
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
⋅
(
1
+
ϵ
n
,
p
(
k
)
)
{\displaystyle \operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;=\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}\operatorname {P} \left(S_{n}=k\right)\;=\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\cdot (1+\epsilon _{n,p}(k))}
wobei
lim
n
→
∞
ϵ
n
,
p
(
k
)
=
0
{\displaystyle \lim _{n\to \infty }\epsilon _{n,p}(k)=\;0}
.
Setzen wir nun
ϵ
¯
n
,
p
:=
sup
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
|
ϵ
n
,
p
(
k
)
|
{\displaystyle {\bar {\epsilon }}_{n,p}:=\sup _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}|\epsilon _{n,p}(k)|}
so ergibt sich:
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
⋅
ϵ
n
,
p
(
k
)
)
≤
ϵ
¯
n
,
p
⋅
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
{\displaystyle \sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\cdot \epsilon _{n,p}(k))\;\leq \;{\bar {\epsilon }}_{n,p}\cdot \sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
und im Limes
n
→
∞
{\displaystyle n\to \infty }
folgt:
lim
n
→
∞
ϵ
n
,
p
⏟
→
0
⋅
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
⏟
→
∫
a
b
…
<
∞
=
0
{\displaystyle \lim _{n\to \infty }\;\underbrace {\quad \epsilon _{n,p}\quad } _{\to 0}\cdot \underbrace {\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)} _{\to \int _{a}^{b}\ldots <\infty }=0}
Und daher gilt im Limes
n
→
∞
{\displaystyle n\to \infty }
:
P
(
x
1
≤
S
n
−
n
p
n
≤
x
2
)
=
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
{\displaystyle \operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;=\;\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
Im Folgenden wird für die Riemann-Summe die Integraldarstellung gezeigt:
lim
n
→
∞
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
=
1
2
π
σ
2
∫
x
1
x
2
exp
(
−
x
2
2
σ
2
)
d
x
{\displaystyle \lim _{n\to \infty }\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\;=\;{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x}
Wir bilden ein äquidistantes Gitter
Γ
n
:=
{
k
−
n
p
n
|
k
=
0
,
1
,
…
,
n
}
⊆
R
{\displaystyle \Gamma _{n}:=\left\{\left.{\tfrac {k-np}{\sqrt {n}}}\right|\,k=0,1,\ldots ,n\right\}\subseteq \mathrm {R} }
der Maschenweite
1
n
{\displaystyle {\frac {1}{\sqrt {n}}}}
und können somit die Riemann-Summe in ein Riemannintegral überführen:
lim
n
→
∞
∑
k
∈
{
0
,
1
…
,
n
}
x
1
≤
k
−
n
p
n
≤
x
2
1
2
π
n
σ
2
exp
(
−
n
2
σ
2
(
k
n
−
p
)
2
)
=
lim
n
→
∞
∑
x
∈
Γ
n
x
1
≤
x
≤
x
2
1
2
π
σ
2
exp
(
−
n
2
σ
2
(
k
−
n
p
n
)
2
)
⋅
1
n
=
1
2
π
σ
2
∫
x
1
x
2
exp
(
−
x
2
2
σ
2
)
d
x
{\displaystyle {\begin{aligned}\lim _{n\to \infty }\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\;&=\;\lim _{n\to \infty }\sum _{x\in \Gamma _{n} \atop x_{1}\leq x\leq x_{2}}{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k-np}{n}}\right)^{2}\right)\cdot {\frac {1}{\sqrt {n}}}\;\\&=\;{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x\end{aligned}}}
Unter Verwendung der Ergebnisse aus Schritt 1 und Schritt 2 folgt die eingangs formulierte Behauptung:
lim
n
→
∞
P
(
x
1
≤
S
n
−
n
p
n
≤
x
2
)
=
1
2
π
σ
2
∫
x
1
x
2
exp
(
−
x
2
2
σ
2
)
d
x
{\displaystyle \quad \lim _{n\to \infty }\operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;=\;{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x}
für alle
x
1
,
x
2
∈
R
{\displaystyle x_{1},x_{2}\in \mathbb {R} }
mit
x
1
<
x
2
{\displaystyle x_{1}<x_{2}}
◻
{\displaystyle \Box }