Meest aannemelijke schatter

Uit testwiki
Naar navigatie springen Naar zoeken springen

De methode van de grootste aannemelijkheid of maximum-likelihood-method is in de statistiek een schattingsmethode die als schatting van een parameter die waarde kiest, waarvoor de aannemelijkheidsfunctie een maximum heeft. De schatter heet meest aannemelijke schatter of maximum-likelihood-schatter.

De schatting wordt daarom de meest aannemelijke schatting genoemd. Het is de parameterwaarde die gezien de uitkomst van de steekproef het meest aannemelijk is. Hoe aannemelijk een parameterwaarde is, wordt afgemeten aan de kans of kansdichtheid om bij die waarde van de parameter de uitkomst van de steekproef te vinden.

Geschiedenis

Ronald Fisher in 1913

De methode van de grootste aannemelijkheid is tussen 1912 en 1922 door Ronald Fisher naar voren geschoven en geanalyseerd. Het was nog een heuristische methode, omdat de wiskunde die er aan ten grondslag lag nog niet voldoende was bewezen.[1] De methode was al eerder door Gauss, Laplace, Thiele[2] en Edgeworth gebruikt.[3]

Samuel S. Wilks heeft in 1938 wel de nodige wiskundige grondslag voor de methode gegeven.[4] De stelling die hij gebruikt laat zien dat de fout in de logaritme van de aannemelijkheidswaarden voor schattingen uit meer onafhankelijke steekproeven chi-kwadraat verdeeld is, waardoor het mogelijk is een betrouwbaarheidsgebied te bepalen rond de schattingen. Ironisch genoeg hangt het enige moeilijke deel van het bewijs af van de verwachtingswaarde van de Fisher informatiematrix, die wordt gegeven door een stelling van Fisher.[5] Wilks bleef gedurende zijn leven voortdurend de stelling verbeteren en heeft zijn meest algemene bewijs in 1962 gepubliceerd.[6]

Voorbeelden

Een vreemde munt ziet er in het geheel niet mooi symmetrisch uit. Wat zal bij werpen de kans p op kop zijn? We gooien 10 keer met de munt en vinden 3 keer kop. De kans op deze uitkomst is nog een functie L(p) van p, en wel volgens de binomiale verdeling:

L(p)=P(X=3)=(103)p3(1p)7

De functie L(p) is de aannemelijkheidsfunctie. Hoe groter de kans op de gebeurtenis die plaatsvond, hier de uitkomst X=3, is als functie van p, hoe 'aannemelijker' het ons lijkt dat die kans p de werkelijke kans op kop was. We zoeken nu de waarde van p die het 'meest aannemelijk' is, dus waar de aannemelijkheidsfunctie maximaal is. We zien gemakkelijk dat L(0)=L(1)=0 en dat verder L(p)>0. Het maximum van L wordt met enige wiskunde gevonden bij p=0,3. Dus de meest aannemelijke schatting van p is 0,3.

De uitkomst x1,,xn van een aselecte steekproef is afkomstig uit een normale verdeling met parameters μ en σ2. De aannemelijkheidsfunctie is dus:

L(μ,σ2)=i=1nφ(μ+σxi)=(12πσ2)n/2exp(i=1n(xiμ)22σ2)

Voor het bepalen van het maximum kan men ook de logaritme nemen:

logL(μ,σ2)=n2log(2πσ2)i=1n(xiμ)22σ2

De partiële afgeleiden naar μ en σ2 zijn:

μlogL(μ,σ2)=02i=1n(xiμ)2σ2=i=1n(xiμ)σ2=i=1nxinμσ2

en

σ2logL(μ,σ2)=n2σ2+i=1n(xiμ)22s4

Stelt men deze uitdrukkingen gelijk aan 0, dan krijgt men als oplossing:

μ^=x¯=1ni=1nxi

en

σ^2=1ni=1n(xiμ^)2

Omdat L inderdaad voor deze waarden maximaal is, zijn μ^ en σ^2 dus de meest aannemelijke schatters van μ en σ2.

Sjabloon:Appendix

  1. Sjabloon:Cite book
  2. MacTutor. Thorvald Nicolai Thiele.
  3. Edgeworth september 1908 en Edgeworth december 1908
  4. Sjabloon:Aut. The Large-Sample Distribution of the Likelihood Ratio for Testing Composite Hypotheses, 1938. in Annals of Mathematical Statistics, 9: 60–62. doi:10.1214/aoms/1177732360.
  5. Owen, Art B. (2001). Empirical Likelihood. London: Chapman & Hall/Boca Raton, FL: CRC Press. ISBN 978-1584880714.
  6. Wilks, Samuel S. (1962) Mathematical Statistics. New York: John Wiley & Sons. ISBN 978-0471946502.