Binomiale verdeling

Uit testwiki
Versie door imported>RonaldB op 23 nov 2023 om 13:33 (Wijziging van 145.136.140.69 (Overleg) teruggedraaid naar de laatste versie van Henkgerritblog68)
(wijz) ← Oudere versie | Huidige versie (wijz) | Nieuwere versie → (wijz)
Naar navigatie springen Naar zoeken springen

Sjabloon:Infobox kansverdeling

In de kansrekening en de statistiek is de binomiale verdeling een discrete kansverdeling die de verdeling is van het aantal successen X in een reeks van n onafhankelijke alternatieven alle met succeskans p. Zo'n experiment wordt ook wel een bernoulli-experiment genoemd.

In het geval n=1, komt de binomiale verdeling overeen met de bernoulli-verdeling.

Definitie

In een reeks van n bernoulli-experimenten kunnen 0,1,,n successen voorkomen. Het aantal successen is een stochastische variabele X. Als p de kans op succes is, zegt men dat X binomiaal verdeeld is met parameters n en succeskans p, en noteert:

XB(n,p),

of ook

XBin(n,p)

De kans op precies k successen kan gemakkelijk berekend worden door te bedenken dat elke reeks uitkomsten met k successen en nk mislukkingen dezelfde kans pk(1p)nk heeft. Omdat er (nk) (zie binomiaalcoëfficiënt) verschillende reeksen zijn met precies k successen, wordt de kansfunctie voor k=0,1,,n gegeven door:

f(k;n,p)=P(X=k)=(nk)pk(1p)nk

Voorbeeld

We gooien 4 keer met een (eerlijke) dobbelsteen. We kunnen 0, 1, 2, 3 of 4 keer een 6 gooien. Het aantal keren dat we 6 gooien, X, is B(4,1/6)-verdeeld. Hoe groot is de kans dat we van de 4 worpen 1 keer een 6 gooien? Hier is n=4, p=1/6 en k=1, dus:

P(X=1)=f(1;4,16)=(41)(16)1(116)3=4×16×125216=0,386

Momenten

De verwachtingswaarde en de variantie van een B(n,p)-verdeelde stochastische variabele X laten zich het eenvoudigst bepalen door X te schrijven als de som van n onafhankelijke, B(1,p)-verdeelde variabelen: X=X1++Xn. Dan volgt:

EX=E(X1++Xn)=nE(X1)=np

en

var(X)=var(X1++Xn)=nvar(X1)=np(1p).

De bovenstaande relaties kunnen ook afgeleid worden met behulp van berekeningen soortgelijk aan de volgende:

EX(X1)(X2)=k=0nk(k1)(k2)n!k!(nk)!pk(1p)nk
=n(n1)(n2)p3k=3n(n3)!(k3)!(nk)!pk3(1p)nk=n(n1)(n2)p3.

Uit deze betrekking kan het derde moment EX3 bepaald worden, en daarmee de scheefheid van de verdeling.

Ook volgt daaruit direct:

EX=k=0nkn!k!(nk)!pk(1p)nk=np

en

EX(X1)=k=0nk(k1)n!k!(nk)!pk(1p)nk=n(n1)p2.

Uit deze laatste relatie volgt weer:

EX2=n(n1)p2+np,

zodat

var(X)=EX2(EX)2=n(n1)p2+npn2p2=np(1p).

Benadering

Het is nogal bewerkelijk of bijna ondoenlijk om voor grote waarden van het aantal experimenten n de exacte kansen te berekenen. Dit is ook niet nodig omdat de binomiale verdeling voor grote n benaderd kan worden door een normale verdeling of door een Poissonverdeling.

Als vuistregel neemt men wel dat de B(n,p)-verdeling voor n>25 goed benaderd kan worden door een geschikte normale verdeling, mits de succeskans p niet te klein of te groot is. Als vuistregel geldt: np>5 en n(1p)>5. Voor kleinere en grotere waarden van p is de binomiale verdeling te scheef om door de symmetrische normale verdeling goed benaderd te worden. Een benadering door een geschikte Poissonverdeling is dan mogelijk.

Normale benadering

De stochastische variabele X is B(n,p)-verdeeld. Voor toenemende n nadert de verdeling van X naar een normale verdeling, dus met verwachtingswaarde EX=np en variantie var(X)=np(1p). Er geldt dus:

P(Xk)P(Yk)=P(Zknpnp(1p)).

Daarin is Y N(np,np(1p))-verdeeld en Z standaardnormaal verdeeld.

Omdat de binomiale verdeling een discrete verdeling is, geldt

P(Xk)=P(X<k+1)P(Yk+1),

hetgeen leidt tot twee (en meer) mogelijke benaderingen, die voor niet al te grote waarden van n nogal verschillen. Om dit probleem te ondervangen past men wel de zogenaamde continuïteitscorrectie toe, en neemt als betere benadering een waarde tussen de genoemde uitersten, en wel:

P(Xk)=P(X<k+1)P(Yk+12)=P(Zk+12npnp(1p)).

Voorbeeld

Hoe groot is de kans om in 25 worpen met een zuivere munt ten hoogste 10 keer kruis te gooien? Noem X het aantal keren kruis; X is dus B(25,12)-verdeeld is. De gevraagde kans is:

P(X10)=0,2122.

Omdat EX=np=12,5 en var(X)=np(1p)=6,25, kan deze kans benaderd worden met behulp van een N(12,5;6,25)-verdeling.

P(X10)P(Y10)=P(Z1012,56,25)=P(Z<1)=0,1587.

Men kan ook berekenen:

P(X<11)P(Y<11)=P(Z1112,56,25)=P(Z<0,6)=0,2743.

Dat zijn twee benaderingen die nogal uiteenlopen, maar waar de werkelijke waarde wel tussen ligt. Met de continuïteitscorrectie wordt de benadering:

P(X10)P(Y10,5)=P(Z10,512,56,25)=P(Z<0,8)=0,2119.

Poissonbenadering

Omdat de B(n,p)-verdeling voor toenemende n en constante waarde van np=μ nadert naar de Poissonverdeling met parameter μ, kan de B(n,p)-verdeling voor grote waarden van n en waarden van p in de buurt van 0 benaderd worden door een geschikte Poissonverdeling. In dat geval geldt dus: XB(n,p):

P(Xk)P(Yk).

Daarin is Y Poissonverdeeld met parameter np.

Ook voor waarden van p in de buurt van 1 kan deze benadering gebruikt worden, zij het dat men niet de verdeling van X benadert, maar de verdeling van nX, die B(n,1p)-verdeeld is, dus met een kleine waarde van Bp.

Voorbeeld

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen ten hoogste 2 keer 6 te gooien? Noem X het aantal keren 6. Dus X is B(25,1/6)-verdeeld. De gevraagde kans is:

P(X2)=0,1887.

Omdat EX=np=25/6 kan we deze kans benaderd worden met behulp van een Poissonverdeling met parameter 25/6.

P(X2)P(Y2)=0,2147.

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen minstens 20 keer geen 6 te gooien? Noem X het aantal keren dat geen 6 gegooid wordt. X is dus B(25,5/6)-verdeeld. De gevraagde kans is:

P(X20)=0,7720.

Nu is p tamelijk groot, maar de vraag kan ook geformuleerd worden als de kans op ten hoogste 5 keer 6.

P(X20)=P(25X5).

En 25X is weer B(25,1/6)-verdeeld, dus:

P(X20)=P(25X5)P(Y5)=0,7586.

Zie ook

Sjabloon:Navigatie kansverdelingen Sjabloon:Commonscat