Satz von Moivre-Laplace
Bearbeiten
Sei X 1 , X 2 , X 3 , ⋯ {\displaystyle X_{1},X_{2},X_{3},\cdots } eine Folge bernoulli-verteilter Zufallsvariablen und deren Summe S n {\displaystyle S_{n}} binomialverteilt mit Parametern n ∈ N {\displaystyle n\in \mathbb {N} } , p ∈ ] 0 , 1 [ {\displaystyle p\in ]0,1[} und σ 2 = p ( 1 − p ) {\displaystyle \sigma ^{2}=p(1-p)} . Dann gilt:
(1) P ( S n = k ) = B ( k ∣ p , n ) ≈ 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) {\displaystyle \quad \operatorname {P} \left(S_{n}=k\right)\;=\;B(k\mid p,n)\;\approx \;{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
(2) lim n → ∞ P ( x 1 ≤ S n − n p n ≤ x 2 ) = 1 2 π σ 2 ∫ x 1 x 2 exp ( − x 2 2 σ 2 ) d x {\displaystyle \quad \lim _{n\to \infty }\operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x} für alle x 1 , x 2 ∈ R {\displaystyle x_{1},x_{2}\in \mathbb {R} } mit x 1 < x 2 {\displaystyle x_{1}<x_{2}}
Nach Gauß lässt sich die Gammafunktion Γ ( x ) {\displaystyle \Gamma (x)} für alle x ∈ C ∖ { 0 , − 1 , − 2 , … } {\displaystyle x\in \mathbb {C} \setminus \{0,-1,-2,\dotsc \}} und alle n ∈ N 0 {\displaystyle n\in \mathbb {N} _{0}} durch eine Produktdarstellung definieren
Γ ( x ) = lim n → ∞ n ! n x x ( x + 1 ) ( x + 2 ) ⋯ ( x + n ) {\displaystyle \Gamma (x)=\lim _{n\to \infty }{\frac {n!\,n^{x}}{x(x+1)(x+2)\dotsm (x+n)}}} .Bemerkungen:
Es gilt n ! = Γ ( n + 1 ) = n Γ ( n ) {\displaystyle n!=\Gamma (n+1)=n\Gamma (n)} .
Die Stirlingformel lautet n ! = lim n → ∞ ( 2 π n ( n e ) n + ϵ n ) {\displaystyle n!=\lim _{n\to \infty }\left({\sqrt {2\pi n}}\;\left({\tfrac {n}{\mathrm {e} }}\right)^{n}+\epsilon _{n}\right)}
Nachfolgend wird das Näherungszeichen "≈ {\displaystyle \approx } " verwendet, wenn eine Approximation durchgeführt wird. Ein Gleichheitszeichen "= {\displaystyle =} " wird gesetzt, wenn eine Umformung erfolgt. Satz (Stirling-Formel und Gammafunktion)
Bearbeiten
In der Halbebene Re ( x ) > 0 {\displaystyle \operatorname {Re} (x)>0} gilt
log Γ ( x ) = ( x − 1 2 ) log x − x + log 2 π + O ( 1 | x | ) {\displaystyle \log \Gamma (x)=(x-{\tfrac {1}{2}})\log x-x+\log {\sqrt {2\pi }}+{\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}} .Dabei ist log x {\displaystyle \log x} der Hauptzweig des Logarithmus (der reell ist für positive reelle x {\displaystyle x} ) und ebenso ist log Γ ( x ) {\displaystyle \log \Gamma (x)} reell für positive reelle x > 0 {\displaystyle x>0} .
Nach Gauß ist
Γ ( x ) = lim n → ∞ n ! n x x ( x + 1 ) ( x + 2 ) ⋯ ( x + n ) {\displaystyle \Gamma (x)=\lim _{n\to \infty }{\frac {n!\,n^{x}}{x(x+1)(x+2)\dotsm (x+n)}}} also
log Γ ( x ) = lim n → ∞ ( log n ! + x log n − ∑ k = 0 n log ( x + k ) ) {\displaystyle \log \Gamma (x)=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-\sum _{k=0}^{n}\log(x+k){\bigg )}}
Die Anwendung des Korollars ergibt für ein festes und beliebiges x {\displaystyle x} mit d 2 f ( t ) d t 2 | t = k = d 2 log ( x + t ) d t 2 | t = k = 1 ( x + t ) 2 {\displaystyle {\bigg .}{\tfrac {\mathrm {d} ^{2}f(t)}{\mathrm {d} t^{2}}}{\bigg |}_{t=k}={\bigg .}{\tfrac {\mathrm {d} ^{2}\log(x+t)}{\mathrm {d} t^{2}}}{\bigg |}_{t=k}={\tfrac {1}{(x+t)^{2}}}} und nach Umformung ∑ k = 0 n log ( x + k ) = ∫ 0 n log ( x + t ) d t + 1 2 ( log x + log ( x + n ) ) + ∫ 0 n φ ( t ) 1 ( x + t ) 2 d t {\displaystyle \sum _{k=0}^{n}\log(x+k)=\int _{0}^{n}\log(x+t)\mathrm {d} t+{\frac {1}{2}}{\bigg (}\log x+\log(x+n){\bigg )}\;+\;\int _{0}^{n}\varphi (t){\tfrac {1}{(x+t)^{2}}}\mathrm {d} t} und somit
log Γ ( x ) = lim n → ∞ ( log n ! + x log n − ∫ 0 n log ( x + t ) d t − 1 2 ( log x + log ( x + n ) ) − ∫ 0 n φ ( t ) 1 ( x + t ) 2 d t ) {\displaystyle \log \Gamma (x)=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-\int \limits _{0}^{n}\log(x+t)\mathrm {d} t-{\frac {1}{2}}{\Big (}\log x+\log(x+n){\Big )}-\int \limits _{0}^{n}\varphi (t){\frac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg )}}
Wegen | φ ( t ) | ≤ 1 8 {\displaystyle {\big |}\varphi (t){\big |}\leq {\tfrac {1}{8}}} ergibt sich | ∫ 0 n φ ( t ) 1 ( x + t ) 2 d t | ≤ 1 8 | ∫ 0 n 1 ( x + t ) 2 d t | {\displaystyle {\bigg |}\int _{0}^{n}\varphi (t){\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}\leq {\tfrac {1}{8}}{\bigg |}\int _{0}^{n}{\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}} und wegen 1 8 | ∫ 0 n 1 ( x + t ) 2 d t | = 1 8 | [ − 1 x + t ] 0 n | = 1 8 | − 1 x + n − − 1 x | = 1 8 | − x − n + x − x ( x + n ) | = 1 8 | 1 x ( x n + 1 ) | ≤ 1 8 1 | x | ≈ O ( 1 | x | ) {\displaystyle {\tfrac {1}{8}}{\bigg |}\int _{0}^{n}{\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}={\tfrac {1}{8}}{\bigg |}{\bigg [}{\tfrac {-1}{x+t}}{\bigg ]}_{0}^{n}{\bigg |}={\tfrac {1}{8}}{\bigg |}{\tfrac {-1}{x+n}}-{\tfrac {-1}{x}}{\bigg |}={\tfrac {1}{8}}{\bigg |}{\tfrac {-x-n+x}{-x(x+n)}}{\bigg |}={\tfrac {1}{8}}{\bigg |}{\tfrac {1}{x({\tfrac {x}{n}}+1)}}{\bigg |}\leq {\tfrac {1}{8}}{\tfrac {1}{|x|}}\approx {\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}} ist die Näherung | ∫ 0 n φ ( t ) 1 ( x + t ) 2 d t | ≈ O ( 1 | x | ) {\displaystyle {\bigg |}\int _{0}^{n}\varphi (t){\tfrac {1}{(x+t)^{2}}}\mathrm {d} t{\bigg |}\approx {\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}} zulässig. Unter Auslassung des Fehlerterms O ( 1 | x | ) {\displaystyle {\mathcal {O}}{\Big (}{\tfrac {1}{|x|}}{\Big )}} der Approximation folgt
log Γ ( x ) = lim n → ∞ ( log n ! + x log n − ∫ 0 n log ( x + t ) d t − 1 2 ( log x + log ( x + n ) ) ) {\displaystyle \log \Gamma (x)=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-\int \limits _{0}^{n}\log(x+t)\mathrm {d} t-{\frac {1}{2}}{\Big (}\log x+\log(x+n){\Big )}{\bigg )}}
Partielle Integration liefert ∫ 0 n log ( x + t ) d t = [ ( x + t ) log ( x + t ) − 1 ] 0 n = ( x + n ) log ( x + n ) − x log x + C {\displaystyle \int _{0}^{n}\log(x+t)\mathrm {d} t={\Big [}(x+t)\log(x+t)-1{\Big ]}_{0}^{n}=(x+n)\log(x+n)-x\log x+C} . Da die Integrationskonstante o.B.d.A. gewählt werden kann, sei C = − n {\displaystyle C=-n} und damit
log Γ ( x ) = lim n → ∞ ( log n ! + x log n − ( x + n ) log ( x + n ) + x log x + n − 1 2 ( log x + log ( x + n ) ) ) = lim n → ∞ ( log n ! + x log n − ( x + n + 1 2 ) log ( x + n ) + ( x − 1 2 ) log x + n ) {\displaystyle {\begin{aligned}\log \Gamma (x)&=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-{\Big (}x+n{\Big )}\log(x+n)+x\log x+n-{\frac {1}{2}}{\Big (}\log x+\log(x+n){\Big )}{\bigg )}\\&=\lim _{n\to \infty }{\bigg (}\log n!+x\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}\log(x+n)+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+n{\bigg )}\end{aligned}}}
Es wird ein indirekter Beweis mit der Stirling-Formel n ! = lim n → ∞ ( 2 π n ( n e ) n + ϵ n ) {\displaystyle n!=\lim _{n\to \infty }\left({\sqrt {2\pi n}}\;\left({\tfrac {n}{\mathrm {e} }}\right)^{n}+\epsilon _{n}\right)} , log e = 1 {\displaystyle \log e=1} und log ϵ n = ϵ n ′ {\displaystyle \log \epsilon _{n}=\epsilon _{n}'} durchgeführt, wobei log n ! = lim n → ∞ ( ( n + 1 2 ) log n − n + log 2 π + ϵ n ′ ) {\displaystyle \log n!=\lim _{n\to \infty }\left((n+{\tfrac {1}{2}})\log n-n+\log {\sqrt {2\pi }}+\epsilon _{n}'\right)} ist und damit
log Γ ( x ) = lim n → ∞ ( ( n + 1 2 ) log n − n + x log n − ( x + n + 1 2 ) log ( x + n ) + ( x − 1 2 ) log x + n + ϵ n ′ ) + log 2 π = lim n → ∞ ( ( x + n + 1 2 ) log n − ( x + n + 1 2 ) log ( x + n ) + ϵ n ′ ) + ( x − 1 2 ) log x + log 2 π {\displaystyle {\begin{aligned}\log \Gamma (x)&=\lim _{n\to \infty }{\bigg (}{\Big (}n+{\frac {1}{2}}{\Big )}\log n-n+x\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}\log(x+n)+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+n+\epsilon _{n}'{\bigg )}+\log {\sqrt {2\pi }}\\&=\lim _{n\to \infty }{\bigg (}{\Big (}x+n+{\frac {1}{2}}{\Big )}\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}\log(x+n)+\epsilon _{n}'{\bigg )}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+\log {\sqrt {2\pi }}\end{aligned}}}
Nun ist log ( x + n ) = log ( n ( 1 + x n ) ) = log n + log ( 1 + x n ) {\displaystyle \log(x+n)=\log(n(1+{\tfrac {x}{n}}))=\log n+\log(1+{\tfrac {x}{n}})} und für festes x {\displaystyle x} und grosses n {\displaystyle n} gilt log ( 1 + x n ) ≈ x n + O ( 1 n 2 ) {\displaystyle \log(1+{\tfrac {x}{n}})\approx {\tfrac {x}{n}}+{\mathcal {O}}{\Big (}{\tfrac {1}{n^{2}}}{\Big )}} . Unter Auslassung des Fehlerterms O ( 1 n 2 ) {\displaystyle {\mathcal {O}}{\Big (}{\tfrac {1}{n^{2}}}{\Big )}} erhalten wir mit log ( x + n ) = log n + x n {\displaystyle \log(x+n)=\log n+{\tfrac {x}{n}}}
log Γ ( x ) = log 2 π + ( x − 1 2 ) log x + lim n → ∞ ( ( x + n + 1 2 ) log n − ( x + n + 1 2 ) ( log n + x n ) + ϵ n ′ ) = log 2 π + ( x − 1 2 ) log x + lim n → ∞ ( − x n ( x + n + 1 2 ) + ϵ n ′ ) = log 2 π + ( x − 1 2 ) log x − x {\displaystyle {\begin{aligned}\log \Gamma (x)&=\log {\sqrt {2\pi }}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+\lim _{n\to \infty }{\bigg (}{\Big (}x+n+{\frac {1}{2}}{\Big )}\log n-{\Big (}x+n+{\frac {1}{2}}{\Big )}{\Big (}\log n+{\frac {x}{n}}{\Big )}+\epsilon _{n}'{\bigg )}\\&=\log {\sqrt {2\pi }}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x+\lim _{n\to \infty }{\bigg (}-{\frac {x}{n}}(x+n+{\frac {1}{2}})+\epsilon _{n}'{\bigg )}\\&=\log {\sqrt {2\pi }}+{\Big (}x-{\frac {1}{2}}{\Big )}\log x-x\end{aligned}}} ◻ {\displaystyle \Box }
An dieser Stelle sei erwähnt, dass diese Näherung für x ≥ 9 {\displaystyle x\geq 9} mit einem relativen Fehler von kleiner als 1 % {\displaystyle 1\%} behaftet ist.
Für die weitere Beweisführung seien folgende Umformungen angegeben:
Γ ( x ) ≈ 2 π x ( x − 1 2 ) e − x {\displaystyle \Gamma (x)\approx {\sqrt {2\pi }}x^{{\Big (}x-{\frac {1}{2}}{\Big )}}e^{-x}}
und wegen n ! = Γ ( n + 1 ) = n Γ ( n ) {\displaystyle n!=\Gamma (n+1)=n\Gamma (n)} folgt
n ! = n Γ ( n ) ≈ n 2 π n ( n − 1 2 ) e − n = 2 π n ( n e ) n = n n e − n 2 π n {\displaystyle n!=n\Gamma (n)\approx n{\sqrt {2\pi }}n^{{\Big (}n-{\tfrac {1}{2}}{\Big )}}e^{-n}={\sqrt {2\pi n}}{\bigg (}{\frac {n}{e}}{\bigg )}^{n}=n^{n}e^{-n}{\sqrt {2\pi n}}}
Der Beweis wird in zwei Schritten durchgeführt.
Zunächst wird gezeigt:
B ( k ∣ p , n ) ≈ n n e − n 2 π n k k e − k 2 π k ( n − k ) n − k e − ( n − k ) 2 π ( n − k ) p k ( 1 − p ) n − k {\displaystyle B(k\mid p,n)\approx {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}(1-p)^{n-k}} Dazu werden mit Hilfe der Stirlingformel die Fakultäten ersetzt, also folgende Näherungen vorgenommen:
n ! ≈ 2 π n ( n e ) n = n n e − n 2 π n {\displaystyle n!\approx {\sqrt {2\pi n}}\left({\frac {n}{e}}\right)^{n}=n^{n}e^{-n}{\sqrt {2\pi n}}}
k ! ≈ 2 π k ( k e ) k = k k e − k 2 π k {\displaystyle k!\approx {\sqrt {2\pi k}}\left({\frac {k}{e}}\right)^{k}=k^{k}e^{-k}{\sqrt {2\pi k}}}
( n − k ) ! ≈ 2 π ( n − k ) ( n − k e ) n − k = ( n − k ) n − k e − ( n − k ) 2 π ( n − k ) {\displaystyle (n-k)!\approx {\sqrt {2\pi (n-k)}}\left({\frac {n-k}{e}}\right)^{n-k}=(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}} Damit lässt sich die Binomialverteilung wie folgt ausdrücken:
B ( k ∣ p , n ) = ( n k ) p k ( 1 − p ) n − k = n ! k ! ( n − k ) ! p k ( 1 − p ) n − k ≈ n n e − n 2 π n k k e − k 2 π k ( n − k ) n − k e − ( n − k ) 2 π ( n − k ) p k ( 1 − p ) n − k = n 2 π k ( n − k ) n n k k ( n − k ) n − k p k ( 1 − p ) n − k = n 2 π k ( n − k ) ( n p k ) k ( n ( 1 − p ) n − k ) n − k = 1 2 π n k n ( 1 − k n ) ( n p k ) k ( n ( 1 − p ) n − k ) n − k {\displaystyle {\begin{aligned}B(k\mid p,n)&={n \choose k}p^{k}(1-p)^{n-k}\\&={\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}\\&\approx {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}(n-k)^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}(1-p)^{n-k}\\&={\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}{\frac {n^{n}}{k^{k}\left(n-k\right)^{n-k}}}p^{k}(1-p)^{n-k}\\&={\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\\&={\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\end{aligned}}}
Mit der Näherung k n ≈ p {\displaystyle {\frac {k}{n}}\approx p} und der Taylorapproximation wird gezeigt:
B ( k ∣ p , n ) ≈ 1 2 π n k n ( 1 − k n ) ( n p k ) k ( n ( 1 − p ) n − k ) n − k ≈ 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) {\displaystyle B(k\mid p,n)\approx {\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\approx {\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
Für hinreichend großes n ≫ k {\displaystyle n\gg k} kann die Näherung k n ≈ p {\displaystyle {\frac {k}{n}}\approx p} verwendet werden, woraus unmittelbar folgt 1 2 π n k n ( 1 − k n ) ≈ 1 2 π n p ( 1 − p ) = 1 2 π n σ 2 {\displaystyle {\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\approx {\frac {1}{\sqrt {2\pi np(1-p)}}}={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}} .
Damit erhalten wir die gewünschte Darstellung und formen die beiden Potenzen in exponentielle Faktoren um, so dass:
B ( k ∣ p , n ) ≈ 1 2 π n σ 2 ( n p k ) k ( n ( 1 − p ) n − k ) n − k = 1 2 π n σ 2 ( p k / n ) k ( ( 1 − p ) 1 − k / n ) n − k = 1 2 π n σ 2 exp ( n n log ( ( p k / n ) k ( 1 − p 1 − k / n ) n − k ) ) = 1 2 π n σ 2 exp ( n n log ( ( k / n p ) − k ( 1 − k / n 1 − p ) − ( n − k ) ) ) = 1 2 π n σ 2 exp ( n ( − k n log ( k / n p ) ⏟ f ( x ) − ( 1 − k n ) log ( 1 − k / n 1 − p ) ⏟ g ( x ) ) ) {\displaystyle {\begin{aligned}B(k\mid p,n)&\approx {\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\left({\frac {p}{k/n}}\right)^{k}\left({\frac {(1-p)}{1-k/n}}\right)^{n-k}\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left({\frac {n}{n}}\log \left(\left({\frac {p}{k/n}}\right)^{k}\left({\frac {1-p}{1-k/n}}\right)^{n-k}\right)\right)\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left({\frac {n}{n}}\log \left(\left({\frac {k/n}{p}}\right)^{-k}\left({\frac {1-k/n}{1-p}}\right)^{-(n-k)}\right)\right)\\&={\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp {\Bigg (}n{\bigg (}-\underbrace {{\frac {k}{n}}\log \left({\frac {k/n}{p}}\right)} _{f(x)}-\underbrace {\left(1-{\frac {k}{n}}\right)\log \left({\frac {1-k/n}{1-p}}\right)} _{g(x)}{\bigg )}{\Bigg )}\end{aligned}}}
Um die Asymptotik der beiden exponentiellen Faktoren zu erhalten, bilden wir die Taylorapproximation in der Annäherung durch die Schmiegparabel . Wir erhalten mit x = k n {\displaystyle x={\frac {k}{n}}} für die Funktionen f ( x ) = x ln x p {\displaystyle f(x)=x\ln {\frac {x}{p}}} und g ( x ) = ( 1 − x ) ln 1 − x 1 − p {\displaystyle g(x)=(1-x)\ln {\frac {1-x}{1-p}}} , um den Entwicklungspunkt x = p {\displaystyle x=p} , folgende Schmiegparabeln:
T 2 f ( x , p ) = ( x ln x p ) | x = p + d d x ( x ln x p ) | x = p ⋅ ( x − p ) + 1 2 d 2 d x 2 ( x ln x p ) | x = p ⋅ ( x − p ) 2 = ( ln x p + x ⋅ p x ⋅ 1 p ) | x = p ⋅ ( x − p ) + 1 2 d d x ( ln x p + 1 ) | x = p ⋅ ( x − p ) 2 = x − p + 1 2 ( p x ⋅ 1 p ) | x = p ⋅ ( x − p ) 2 = x − p + 1 2 p ⋅ ( x − p ) 2 {\displaystyle {\begin{aligned}T_{2}f(x,p)&=\left.\left(x\ln {\frac {x}{p}}\right)\right|_{x=p}+\left.{\frac {\mathrm {d} }{\mathrm {d} x}}\left(x\ln {\frac {x}{p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} ^{2}}{\mathrm {d} x^{2}}}\left(x\ln {\frac {x}{p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=\left.\left(\ln {\frac {x}{p}}+x\cdot {\frac {p}{x}}\cdot {\frac {1}{p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} }{\mathrm {d} x}}\left(\ln {\frac {x}{p}}+1\right)\right|_{x=p}\cdot (x-p)^{2}\\&=x-p+\left.{\frac {1}{2}}\left({\frac {p}{x}}\cdot {\frac {1}{p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=x-p+{\frac {1}{2p}}\cdot (x-p)^{2}\end{aligned}}}
und
T 2 g ( x , p ) = ( ( 1 − x ) ln 1 − x 1 − p ) | x = p + d d x ( ( 1 − x ) ln 1 − x 1 − p ) | x = p ⋅ ( x − p ) + 1 2 d 2 d x 2 ( ( 1 − x ) ln 1 − x 1 − p ) | x = p ⋅ ( x − p ) 2 = ( − ln 1 − x 1 − p + ( 1 − x ) ⋅ 1 − p 1 − x ⋅ − 1 1 − p ) | x = p ⋅ ( x − p ) + 1 2 d d x ( − ln 1 − x 1 − p − 1 ) | x = p ⋅ ( x − p ) 2 = − ( x − p ) − 1 2 ( 1 − p 1 − x ⋅ − 1 1 − p ) | x = p ⋅ ( x − p ) 2 = − ( x − p ) + 1 2 ( 1 − p ) ⋅ ( x − p ) 2 {\displaystyle {\begin{aligned}T_{2}g(x,p)&=\left.\left((1-x)\ln {\frac {1-x}{1-p}}\right)\right|_{x=p}+\left.{\frac {\mathrm {d} }{\mathrm {d} x}}\left((1-x)\ln {\frac {1-x}{1-p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} ^{2}}{\mathrm {d} x^{2}}}\left((1-x)\ln {\frac {1-x}{1-p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=\left.\left(-\ln {\frac {1-x}{1-p}}+(1-x)\cdot {\frac {1-p}{1-x}}\cdot {\frac {-1}{1-p}}\right)\right|_{x=p}\cdot (x-p)+\left.{\frac {1}{2}}{\frac {\mathrm {d} }{\mathrm {d} x}}\left(-\ln {\frac {1-x}{1-p}}-1\right)\right|_{x=p}\cdot (x-p)^{2}\\&=-(x-p)-\left.{\frac {1}{2}}\left({\frac {1-p}{1-x}}\cdot {\frac {-1}{1-p}}\right)\right|_{x=p}\cdot (x-p)^{2}\\&=-(x-p)+{\frac {1}{2(1-p)}}\cdot (x-p)^{2}\end{aligned}}}
Bemerkungen: zu beachten ist d d x ln h ( x ) = h ′ ( x ) h ( x ) {\displaystyle {\frac {\mathrm {d} }{\mathrm {d} x}}\ln h(x)={\frac {h'(x)}{h(x)}}} und der Fehler dieser Näherung wird durch das Integralrestglied R 2 f ( x , p ) {\displaystyle R_{2}f(x,p)} bzw. R 2 g ( x , p ) {\displaystyle R_{2}g(x,p)} repräsentiert.
Die Zusammenfassung beider Taylorapproximationen liefert dann mit σ 2 = p ( 1 − p ) {\displaystyle \sigma ^{2}=p(1-p)} und unter Auslassung der Restglieder:
T 2 f ( x , p ) + T 2 g ( x , p ) = x − p + 1 2 p ⋅ ( x − p ) 2 − ( x − p ) + 1 2 ( 1 − p ) ⋅ ( x − p ) 2 = 1 2 p ⋅ ( x − p ) 2 + 1 2 ( 1 − p ) ⋅ ( x − p ) 2 = 1 − p + p 2 p ( 1 − p ) ⋅ ( x − p ) 2 = 1 2 p ( 1 − p ) ⋅ ( x − p ) 2 = 1 2 σ 2 ⋅ ( x − p ) 2 {\displaystyle {\begin{aligned}T_{2}f(x,p)+T_{2}g(x,p)&=x-p+{\frac {1}{2p}}\cdot (x-p)^{2}-(x-p)+{\frac {1}{2(1-p)}}\cdot (x-p)^{2}\\&={\frac {1}{2p}}\cdot (x-p)^{2}+{\frac {1}{2(1-p)}}\cdot (x-p)^{2}\\&={\frac {1-p+p}{2p(1-p)}}\cdot (x-p)^{2}\\&={\frac {1}{2p(1-p)}}\cdot (x-p)^{2}\\&={\frac {1}{2\sigma ^{2}}}\cdot (x-p)^{2}\end{aligned}}}
Insgesamt ergibt sich mit den unterschiedlichen Näherungen die Eingangs zitierte Aussage:
B ( k ∣ p , n ) ≈ 1 2 π n k n ( 1 − k n ) ( n p k ) k ( n ( 1 − p ) n − k ) n − k ≈ 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) {\displaystyle B(k\mid p,n)\approx {\frac {1}{\sqrt {2\pi n{\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\left({\frac {np}{k}}\right)^{k}\left({\frac {n(1-p)}{n-k}}\right)^{n-k}\;\approx \;{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)} ◻ {\displaystyle \Box }
Gezeigt wird, dass aus dem lokalen Grenzwertsatz im Limes n → ∞ {\displaystyle n\rightarrow \infty } und der Riemann-Summe folgt:
P ( x 1 ≤ S n − n p n ≤ x 2 ) = 1 2 π σ 2 ∫ x 1 x 2 exp ( − x 2 2 σ 2 ) d x {\displaystyle \operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x} für alle x 1 , x 2 ∈ R {\displaystyle x_{1},x_{2}\in \mathbb {R} } mit x 1 < x 2 {\displaystyle x_{1}<x_{2}}
Zunächst folgt mit dem lokalen Grenzwertsatz:
P ( x 1 ≤ S n − n p n ≤ x 2 ) = ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 P ( S n = k ) = ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) ⋅ ( 1 + ϵ n , p ( k ) ) {\displaystyle \operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;=\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}\operatorname {P} \left(S_{n}=k\right)\;=\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\cdot (1+\epsilon _{n,p}(k))} wobei lim n → ∞ ϵ n , p ( k ) = 0 {\displaystyle \lim _{n\to \infty }\epsilon _{n,p}(k)=\;0} .
Setzen wir nun ϵ ¯ n , p := sup k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 | ϵ n , p ( k ) | {\displaystyle {\bar {\epsilon }}_{n,p}:=\sup _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}|\epsilon _{n,p}(k)|} so ergibt sich:
∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) ⋅ ϵ n , p ( k ) ) ≤ ϵ ¯ n , p ⋅ ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) {\displaystyle \sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\cdot \epsilon _{n,p}(k))\;\leq \;{\bar {\epsilon }}_{n,p}\cdot \sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)} und im Limes n → ∞ {\displaystyle n\to \infty } folgt:
lim n → ∞ ϵ n , p ⏟ → 0 ⋅ ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) ⏟ → ∫ a b … < ∞ = 0 {\displaystyle \lim _{n\to \infty }\;\underbrace {\quad \epsilon _{n,p}\quad } _{\to 0}\cdot \underbrace {\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)} _{\to \int _{a}^{b}\ldots <\infty }=0} Und daher gilt im Limes n → ∞ {\displaystyle n\to \infty } :
P ( x 1 ≤ S n − n p n ≤ x 2 ) = ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) {\displaystyle \operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;=\;\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)}
Im Folgenden wird für die Riemann-Summe die Integraldarstellung gezeigt:
lim n → ∞ ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) = 1 2 π σ 2 ∫ x 1 x 2 exp ( − x 2 2 σ 2 ) d x {\displaystyle \lim _{n\to \infty }\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\;=\;{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x} Wir bilden ein äquidistantes Gitter Γ n := { k − n p n | k = 0 , 1 , … , n } ⊆ R {\displaystyle \Gamma _{n}:=\left\{\left.{\tfrac {k-np}{\sqrt {n}}}\right|\,k=0,1,\ldots ,n\right\}\subseteq \mathrm {R} } der Maschenweite 1 n {\displaystyle {\frac {1}{\sqrt {n}}}} und können somit die Riemann-Summe in ein Riemannintegral überführen:
lim n → ∞ ∑ k ∈ { 0 , 1 … , n } x 1 ≤ k − n p n ≤ x 2 1 2 π n σ 2 exp ( − n 2 σ 2 ( k n − p ) 2 ) = lim n → ∞ ∑ x ∈ Γ n x 1 ≤ x ≤ x 2 1 2 π σ 2 exp ( − n 2 σ 2 ( k − n p n ) 2 ) ⋅ 1 n = 1 2 π σ 2 ∫ x 1 x 2 exp ( − x 2 2 σ 2 ) d x {\displaystyle {\begin{aligned}\lim _{n\to \infty }\sum _{k\in \{0,1\ldots ,n\} \atop x_{1}\leq {\frac {k-np}{\sqrt {n}}}\leq x_{2}}{\frac {1}{\sqrt {2\pi n\sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k}{n}}-p\right)^{2}\right)\;&=\;\lim _{n\to \infty }\sum _{x\in \Gamma _{n} \atop x_{1}\leq x\leq x_{2}}{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,\exp \left(-{\frac {n}{2\sigma ^{2}}}\left({\frac {k-np}{n}}\right)^{2}\right)\cdot {\frac {1}{\sqrt {n}}}\;\\&=\;{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x\end{aligned}}} Unter Verwendung der Ergebnisse aus Schritt 1 und Schritt 2 folgt die eingangs formulierte Behauptung:
lim n → ∞ P ( x 1 ≤ S n − n p n ≤ x 2 ) = 1 2 π σ 2 ∫ x 1 x 2 exp ( − x 2 2 σ 2 ) d x {\displaystyle \quad \lim _{n\to \infty }\operatorname {P} \left(x_{1}\leq {\frac {S_{n}-np}{\sqrt {n}}}\leq x_{2}\right)\;=\;{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\int _{x_{1}}^{x_{2}}\exp \left(-{x^{2} \over 2\sigma ^{2}}\right)\mathrm {d} x} für alle x 1 , x 2 ∈ R {\displaystyle x_{1},x_{2}\in \mathbb {R} } mit x 1 < x 2 {\displaystyle x_{1}<x_{2}} ◻ {\displaystyle \Box }