Sådan beregner man varians: forklaring med eksempler

Indholdsfortegnelse:

Sådan beregner man varians: forklaring med eksempler
Sådan beregner man varians: forklaring med eksempler
Anonim

Sandsynlighedsteori arbejder med tilfældige variable. For stokastiske variable er der såkaldte fordelingslove. En sådan lov beskriver dens tilfældige variabel med absolut fuldstændighed. Men når man arbejder med reelle sæt af stokastiske variable, er det ofte meget vanskeligt umiddelbart at fastslå loven for deres fordeling og er begrænset til et bestemt sæt numeriske karakteristika. For eksempel er det ofte meget nyttigt at beregne middelværdien og variansen af en stokastisk variabel.

Hvorfor er det nødvendigt

Hvis essensen af den matematiske forventning er tæt på middelværdien af mængden, så fortæller spredningen i dette tilfælde, hvordan værdierne af vores mængde er spredt rundt om denne matematiske forventning. Hvis vi for eksempel målte en gruppe menneskers IQ og ønsker at undersøge måleresultaterne (stikprøven), vil den matematiske forventning vise den omtrentlige gennemsnitsværdi af intelligenskvotienten for denne gruppe mennesker, og hvis vi beregner stikprøvevariansen, vil vi finde ud af, hvordan resultaterne er grupperet omkring den matematiske forventning: en flok i nærheden af den (lille variation i IQ) eller mere jævnt over hele området fra minimum til maksimum resultat (stor variation, og et sted i midten - matematisk forventning).

For at beregne variansen skal du bruge en ny karakteristik af en tilfældig variabel - værdiens afvigelse fra den matematiskeventer.

Afvigelse

For at forstå, hvordan man beregner variansen, skal du først forstå afvigelsen. Dens definition er forskellen mellem den værdi, som en tilfældig variabel tager, og dens matematiske forventning. For at forstå, hvordan en værdi er "spredt", skal man groft sagt se på, hvordan dens afvigelse er fordelt. Det vil sige, at vi erstatter værdien af værdien med værdien af dens afvigelse fra måtten. forventninger og udforsk dens distributionslov.

Fordelingsloven for en diskret, det vil sige en stokastisk variabel, der antager individuelle værdier, er skrevet i form af en tabel, hvor værdiens værdi er korreleret med sandsynligheden for dens forekomst. Så vil den stokastiske variabel i afvigelsesfordelingsloven erstattes af sin formel, hvori der er en værdi (som har bevaret sin sandsynlighed) og sin egen mat. venter.

egenskaber ved fordelingsloven for afvigelsen af en tilfældig variabel

Vi har nedskrevet fordelingsloven for afvigelsen af en stokastisk variabel. Fra det kan vi indtil videre kun uddrage en sådan karakteristik som den matematiske forventning. For nemheds skyld er det bedre at tage et numerisk eksempel.

Lad der være en fordelingslov for en tilfældig variabel: X - værdi, p - sandsynlighed.

distributionsloven
distributionsloven

Vi beregner den matematiske forventning ved hjælp af formlen og straks afvigelsen.

Forventet værdi
Forventet værdi

Tegner en ny afvigelsesfordelingstabel.

Fordelingslov for afvigelse
Fordelingslov for afvigelse

Vi beregner også forventningen her.

Matematisk forventning til afvigelse
Matematisk forventning til afvigelse

Det viser sig nul. Der er kun ét eksempel, men det vil det altid være: det er ikke svært at bevise dette i den generelle sag. Formlen for den matematiske forventning til afvigelsen kan dekomponeres i forskellen mellem de matematiske forventninger til en stokastisk variabel og, uanset hvor skævt det lyder, måttens matematiske forventning. forventninger (rekursion dog), som er de samme, og deres forskel vil derfor være nul.

Dette forventes: Fortegnsafvigelser kan trods alt være både positive og negative, derfor bør de i gennemsnit give nul.

Sådan beregner man variansen for et diskret tilfælde. mængder

Hvis mat. det er meningsløst at beregne afvigelsesforventningen, man skal kigge efter noget andet. Du kan simpelthen tage de absolutte værdier af afvigelserne (modulo); men med moduler er alt ikke så simpelt, så afvigelserne kvadreres, og så beregnes deres matematiske forventning. Det er faktisk det, der menes, når de taler om, hvordan man beregner variansen.

Det vil sige, at vi tager afvigelserne, kvadrerer dem og laver en tabel med kvadrerede afvigelser og sandsynligheder, der svarer til stokastiske variable. Dette er en ny distributionslov. For at beregne den matematiske forventning skal du tilføje produkterne af kvadratet af afvigelsen og sandsynligheden.

Nemmere formel

Artiklen begyndte dog med, at loven om fordelingen af den indledende stokastiske variabel ofte er ukendt. Så der skal noget lettere til. Faktisk er der en anden formel, der giver dig mulighed for at beregne prøvevariansen ved kun at bruge måtten.venter:

Dispersion - forskellen mellem måtten. forventning om kvadratet af en tilfældig variabel og omvendt kvadratet af dens måtte. venter.

Der er et bevis for dette, men det giver ikke mening at præsentere det her, da det ikke har nogen praktisk værdi (og vi skal kun beregne variansen).

Sådan beregnes variansen af en tilfældig variabel i variationsrækker

I real statistik er det umuligt at afspejle alle tilfældige variable (fordi der groft sagt er et uendeligt antal af dem). Derfor er det, der kommer ind i undersøgelsen, det såkaldte repræsentative udvalg fra en generel almen befolkning. Og da de numeriske karakteristika for enhver tilfældig variabel fra en sådan generel population beregnes ud fra stikprøven, kaldes de stikprøve: stikprøvegennemsnit, henholdsvis stikprøvevarians. Du kan beregne det på samme måde som den sædvanlige (gennem de kvadrerede afvigelser).

Prøveforspændt varians
Prøveforspændt varians

En sådan spredning kaldes imidlertid partisk. Den objektive variansformel ser lidt anderledes ud. Det er norm alt nødvendigt at beregne det.

Prøve upartisk varians
Prøve upartisk varians

Lille tilføjelse

En anden numerisk karakteristik er forbundet med spredning. Det tjener også til at evaluere, hvordan den tilfældige variabel spredes rundt om måtten. forventninger. Der er ikke stor forskel på, hvordan man beregner variansen og standardafvigelsen: sidstnævnte er kvadratroden af førstnævnte.

Anbefalede: