Pearson-distribution: definition, applikation

Indholdsfortegnelse:

Pearson-distribution: definition, applikation
Pearson-distribution: definition, applikation
Anonim

Hvad er Pearsons distributionslov? Svaret på dette brede spørgsmål kan ikke være enkelt og kortfattet. Pearson-systemet blev oprindeligt designet til at modellere synlige forvrængede observationer. På det tidspunkt var det velkendt, hvordan man tunede en teoretisk model til at matche de første to kumulanter eller momenter af observerede data: enhver sandsynlighedsfordeling kan udvides direkte til at danne en gruppe af lokalitetsskalaer.

Pearsons hypotese om normalfordelingen af kriterier

Undtagen i patologiske tilfælde kan lokaliseringsskalaen bringes til at matche den observerede middelværdi (første kumulant) og varians (anden kumulant) på en vilkårlig måde. Det var dog ikke kendt, hvordan man konstruerede sandsynlighedsfordelinger, hvor skævhed (standardiseret tredje kumulant) og kurtosis (standardiseret fjerde kumulant) kunne kontrolleres lige frit. Dette behov blev tydeligt, når man forsøgte at tilpasse kendte teoretiske modeller til observerede data,der viste asymmetri.

I videoen nedenfor kan du se analysen af Pearsons chi-distribution.

Image
Image

Historie

I sit originale arbejde identificerede Pearson fire typer distributioner (nummereret I til IV) ud over normalfordelingen (som oprindeligt var kendt som type V). Klassifikationen afhænger af, om fordelingerne understøttes over et begrænset interval, på en halvakse eller på hele den reelle linje, og om de var potentielt skæve eller nødvendigvis symmetriske.

To udeladelser blev rettet i det andet papir: han omdefinerede type V-fordelingen (oprindeligt var det kun normalfordelingen, men nu med omvendt gamma) og introducerede type VI-fordelingen. Tilsammen dækker de to første artikler de fem hovedtyper af Pearson-systemet (I, III, IV, V og VI). I det tredje papir introducerede Pearson (1916) yderligere undertyper.

Pearson distributionsfunktioner
Pearson distributionsfunktioner

Forbedre konceptet

Rind opfandt en enkel måde at visualisere parameterrummet i Pearson-systemet (eller fordelingen af kriterier), som han senere overtog. I dag bruger mange matematikere og statistikere denne metode. Typerne af Pearson-fordelinger er karakteriseret ved to størrelser, norm alt kaldet β1 og β2. Den første er kvadratet af asymmetri. Det andet er den traditionelle kurtosis eller det fjerde standardiserede moment: β2=γ2 + 3.

Moderne matematiske metoder definerer kurtosis γ2 som kumulanter i stedet for momenter, så for en normalfordeling har vi γ2=0 og β2=3. Her er det værd at følge den historiske præcedens og bruge β2. Diagrammet til højre viser, hvilken type en bestemt Pearson-fordeling er (angivet med prikken (β1, β2).

Pearson statistik
Pearson statistik

Mange af de skæve og/eller ikke-mesokurtiske distributioner, vi kender i dag, var endnu ikke kendt i begyndelsen af 1890'erne. Det, der nu er kendt som beta-fordelingen, blev brugt af Thomas Bayes som den bageste parameter for Bernoulli-fordelingen i hans papir fra 1763 om invers sandsynlighed.

Beta-distributionen blev fremtrædende på grund af dens tilstedeværelse i Pearson-systemet og var indtil 1940'erne kendt som Pearson type I-distributionen. Type II-fordelingen er et speci altilfælde af Type I, men den er norm alt ikke længere udskilt.

Gamma-distributionen stammer fra hans eget arbejde og var kendt som Pearson Type III Normal Distribution, før den fik sit moderne navn i 1930'erne og 1940'erne. Et papir fra 1895 af en videnskabsmand præsenterede Type IV-fordelingen, som indeholder Students t-distribution, som et særligt tilfælde, der går forud for William Seely Gossets efterfølgende brug med flere år. Hans papir fra 1901 præsenterede en fordeling med invers gamma (type V) og beta-primtal (type VI).

En anden mening

Ifølge Ord udviklede Pearson den grundlæggende form for ligning (1) baseret på formlen for den afledede af logaritmen af normalfordelingstæthedsfunktionen (som giver en lineær division med kvadratiskstruktur). Mange specialister er stadig engageret i at teste hypotesen om fordelingen af Pearson-kriterierne. Og det beviser sin effektivitet.

Alternativ Pearson distribution
Alternativ Pearson distribution

Hvem var Karl Pearson

Karl Pearson var en engelsk matematiker og biostatistiker. Han er krediteret for at skabe disciplinen matematisk statistik. I 1911 grundlagde han verdens første afdeling for statistik ved University College London og ydede betydelige bidrag til områderne biometri og meteorologi. Pearson var også tilhænger af socialdarwinisme og eugenik. Han var Sir Francis G altons protegé og biograf.

Biometri

Karl Pearson var medvirkende til at skabe skolen for biometri, som var en konkurrerende teori til at beskrive udviklingen og arven af befolkninger ved begyndelsen af det 20. århundrede. Hans serie på atten artikler "Matematiske bidrag til evolutionsteorien" etablerede ham som grundlæggeren af den biometriske arveskole. Faktisk viede Pearson meget af sin tid i 1893-1904 til udvikling af statistiske metoder til biometri. Disse metoder, som er meget brugt i dag til statistisk analyse, omfatter chi-kvadrat-testen, standardafvigelse, korrelation og regressionskoefficienter.

Pearsons korrelationskoefficient
Pearsons korrelationskoefficient

Spørgsmålet om arvelighed

Pearsons arvelov fastslog, at kimplasmaet består af elementer, der er nedarvet fra forældre såvel som fra fjernere forfædre, hvis andel varierede efter forskellige egenskaber. Karl Pearson var en tilhænger af G alton, og selvom deresværker adskilte sig i nogle henseender, brugte Pearson en betydelig mængde af sin lærers statistiske begreber til at formulere en biometrisk skole for arv, såsom regressionsloven.

Pearson distribution
Pearson distribution

Skolefunktioner

Den biometriske skole var, i modsætning til Mendelianerne, ikke fokuseret på at tilvejebringe en mekanisme for arv, men på at give en matematisk beskrivelse, der ikke var kausal af natur. Mens G alton foreslog en diskontinuerlig evolutionsteori, hvor arter ville ændre sig i store spring frem for små ændringer, der akkumulerede over tid, pegede Pearson på fejl i dette argument og brugte faktisk sine ideer til at udvikle en kontinuerlig evolutionsteori. Mendelianerne foretrak den diskontinuerlige evolutionsteori.

Mens G alton hovedsageligt fokuserede på anvendelsen af statistiske metoder til undersøgelse af arvelighed, udvidede Pearson og hans kollega Weldon deres ræsonnement på dette område, variation, sammenhænge mellem naturlig og seksuel udvælgelse.

Typisk fordeling
Typisk fordeling

Et kig på udviklingen

For Pearson var evolutionsteorien ikke beregnet til at identificere den biologiske mekanisme, der forklarer mønstrene for arv, mens den mendelske tilgang erklærede genet for at være arvemekanismen.

Pearson kritiserede Bateson og andre biologer for ikke at anvende biometriske metoder i deres undersøgelse af evolution. Han fordømte videnskabsmænd, der ikke fokuserede påstatistisk gyldighed af deres teorier, med angivelse af:

"Før vi kan acceptere [enhver årsag til progressiv forandring] som en faktor, skal vi ikke kun vise dens plausibilitet, men om muligt demonstrere dens kvantitative evne."

Biologer er bukket under for "næsten metafysiske spekulationer om årsagerne til arvelighed", som har erstattet processen med at indsamle eksperimentelle data, som faktisk kan give videnskabsfolk mulighed for at indsnævre potentielle teorier.

statistisk bro
statistisk bro

naturlove

For Pearson var naturlovene nyttige til at lave nøjagtige forudsigelser og til at opsummere tendenser i observerede data. Årsagen var oplevelsen "at en bestemt sekvens skete og gentog sig i fortiden."

Det har således ikke været en værdig bestræbelse for biologer at identificere en bestemt mekanisme for genetik, som i stedet bør fokusere på matematiske beskrivelser af de empiriske data. Dette førte til dels til en bitter strid mellem biometrister og Mendelianere, inklusive Bateson.

Efter at sidstnævnte afviste et af Pearsons manuskripter, der beskrev en ny teori om afkomsvariation eller homotypi, grundlagde Pearson og Weldon virksomheden Biometrika i 1902. Selvom den biometriske tilgang til arv til sidst mistede sit mendelske perspektiv, er de metoder, de udviklede på det tidspunkt, afgørende for studiet af biologi og evolution i dag.

Anbefalede: