Grundlæggende begreber for matematisk statistik. Anvendelse af matematisk statistik

Indholdsfortegnelse:

Grundlæggende begreber for matematisk statistik. Anvendelse af matematisk statistik
Grundlæggende begreber for matematisk statistik. Anvendelse af matematisk statistik
Anonim

Matematisk statistik er en metode, der giver dig mulighed for at træffe informerede beslutninger i lyset af usikre forhold. Studiet af metoder til indsamling og systematisering af data, behandling af de endelige resultater af eksperimenter og eksperimenter med massetilfældigheder og opdagelse af eventuelle mønstre er, hvad denne gren af matematik gør. Overvej de grundlæggende begreber i matematisk statistik.

Forskel med sandsynlighedsteori

Metoder til matematisk statistik krydser tæt med sandsynlighedsteori. Begge grene af matematik beskæftiger sig med studiet af talrige tilfældige fænomener. De to discipliner er forbundet med grænsesætninger. Der er dog stor forskel på disse videnskaber. Hvis sandsynlighedsteorien bestemmer karakteristika for en proces i den virkelige verden ud fra en matematisk model, så gør matematisk statistik det modsatte - den sætter modellens egenskaber tilbaseret på observerede oplysninger.

Sandsynlighedsteori og mat. Statistikker
Sandsynlighedsteori og mat. Statistikker

Trin

Anvendelsen af matematisk statistik kan kun udføres i forhold til tilfældige hændelser eller processer, eller rettere, til data opnået ved at observere dem. Og det sker i flere faser. For det første gennemgår data fra eksperimenter og eksperimenter en vis behandling. De er bestilt for klarhed og nem analyse. Derefter foretages et nøjagtigt eller omtrentligt estimat af de nødvendige parametre for den observerede tilfældige proces. De kan være:

  • vurdering af sandsynligheden for en begivenhed (dens sandsynlighed er oprindeligt ukendt);
  • at studere adfærden af en ubestemt distributionsfunktion;
  • forventningsestimat;
  • variansestimation
  • etc.
Grundlæggende om mat. Statistikker
Grundlæggende om mat. Statistikker

Det tredje trin er verifikationen af eventuelle hypoteser, der er sat før analysen, dvs. at få et svar på spørgsmålet om, hvordan resultaterne af eksperimenterne svarer til de teoretiske beregninger. Faktisk er dette hovedstadiet af matematisk statistik. Et eksempel ville være at overveje, om adfærden af en observeret tilfældig proces er inden for normalfordelingen.

Befolkning

De grundlæggende begreber i matematisk statistik omfatter generelle og stikprøvepopulationer. Denne disciplin beskæftiger sig med studiet af et sæt af bestemte objekter med hensyn til nogle egenskaber. Et eksempel er en taxachaufførs arbejde. Overvej disse tilfældige variable:

  • belastning eller antal kunder: pr. dag, før frokost, efter frokost, …;
  • gennemsnitlig rejsetid;
  • antal indgående ansøgninger eller deres tilknytning til bydistrikter og meget mere.

Det er også værd at bemærke, at det er muligt at studere et sæt lignende tilfældige processer, som også vil være en tilfældig variabel, der kan observeres.

Befolkning
Befolkning

Så, i metoderne til matematisk statistik, kaldes hele sæt af objekter, der studeres, eller resultaterne af forskellige observationer, der udføres under de samme forhold på et givet objekt, den generelle befolkning. Med andre ord, matematisk mere strengt, er det en tilfældig variabel, der er defineret i rummet af elementære begivenheder, med en klasse af delmængder udpeget i den, hvis elementer har en kendt sandsynlighed.

Eksempelpopulation

Der er tilfælde, hvor det er umuligt eller upraktisk af en eller anden grund (omkostninger, tid) at udføre en kontinuerlig undersøgelse for at studere hvert objekt. For eksempel er det en tvivlsom beslutning at åbne hver krukke med forseglet marmelade for at kontrollere dens kvalitet, og det er umuligt at prøve at estimere banen for hvert luftmolekyle i en kubikmeter. I sådanne tilfælde anvendes metoden med selektiv observation: et vist antal objekter udvælges (norm alt tilfældigt) fra den almindelige befolkning, og de udsættes for deres analyse.

Prøve fra generalenaggregater
Prøve fra generalenaggregater

Disse begreber kan virke komplicerede i starten. Derfor, for fuldt ud at forstå emnet, skal du studere lærebogen af V. E. Gmurman "Sandsynlighedsteori og matematisk statistik". Således er et stikprøvesæt eller stikprøve en række objekter, der er udvalgt tilfældigt fra det generelle sæt. I strenge matematiske termer er dette en sekvens af uafhængige, ensartet fordelte stokastiske variable, for hver af hvilke fordelingen falder sammen med den, der er angivet for den generelle stokastiske variabel.

Grundlæggende begreber

Lad os kort overveje en række andre grundlæggende begreber inden for matematisk statistik. Antallet af objekter i den generelle befolkning eller prøve kaldes volumen. De prøveværdier, der opnås under eksperimentet, kaldes prøverealiseringen. For at et estimat af den generelle befolkning baseret på en stikprøve er pålidelig, er det vigtigt at have et såkaldt repræsentativt eller repræsentativt udsnit. Det betyder, at stikprøven fuldt ud skal repræsentere populationen. Dette kan kun opnås, hvis alle elementer i populationen har lige stor sandsynlighed for at være med i stikprøven.

Basale koncepter
Basale koncepter

Eksempler skelner mellem returnering og ikke-retur. I det første tilfælde, i indholdet af prøven, returneres det gentagne element til det generelle sæt, i det andet tilfælde er det ikke. Norm alt anvendes i praksis prøveudtagning uden erstatninger. Det skal også bemærkes, at størrelsen af den generelle befolkning altid overstiger stikprøvens størrelse betydeligt. Eksisterermange muligheder for prøvetagningsprocessen:

  • simple - elementer vælges tilfældigt én ad gangen;
  • typed - den generelle befolkning er opdelt i typer, og der foretages et valg fra hver; et eksempel er en undersøgelse af beboere: mænd og kvinder hver for sig;
  • mekanisk - vælg f.eks. hvert 10. element;
  • serie - udvælgelse foretages i serier af elementer.

Statistisk fordeling

Ifølge Gmurman er sandsynlighedsteori og matematisk statistik ekstremt vigtige discipliner i den videnskabelige verden, især i dens praktiske del. Overvej den statistiske fordeling af stikprøven.

Antag, at vi har en gruppe elever, der blev testet i matematik. Som et resultat har vi et sæt estimater: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - dette er vores primære statistiske materiale.

Først og fremmest skal vi sortere det, eller udføre en rangeringsoperation: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - og dermed få en variationsserie. Antallet af gentagelser af hver af vurderingerne kaldes vurderingsfrekvensen, og deres forhold til stikprøvestørrelsen kaldes den relative hyppighed. Lad os lave en tabel over den statistiske fordeling af stikprøven, eller bare en statistisk serie:

ai 1 2 3 4 5
pi 1 1 2 4 3

eller

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Lad os have en tilfældig variabel, som vi vil udføre en række eksperimenter på og se, hvilken værdi denne variabel har. Antag, at hun tog værdien a1 - m1 gange; a2 - m2 gange osv. Størrelsen af denne prøve vil være m1 + … + mk=m. Mættet ai, hvor i varierer fra 1 til k, er en statistisk serie.

Intervalfordeling

I bogen af VE Gmurman "Probability Theory and Mathematical Statistics" præsenteres også en intervalstatistisk serie. Dens kompilering er mulig, når værdien af funktionen under undersøgelse er kontinuerlig i et bestemt interval, og antallet af værdier er stort. Overvej en gruppe elever, eller rettere, deres højde: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 elever i alt. Det er klart, at en persons højde er en kontinuerlig værdi. Vi skal definere interv altrinnet. Til dette bruges Sturges-formlen.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Værdien af 6 kan således tages som størrelsen af intervallet. Det skal også siges, at værdien 1+log2m er formlen forbestemmelse af antallet af intervaller (selvfølgelig med afrunding). I henhold til formlerne opnås således 6 intervaller, som hver har en størrelse på 6. Og den første værdi af det indledende interval vil være tallet bestemt af formlen: min - h / 2=156 - 6/2=153. Lad os lave en tabel, der vil indeholde intervaller og antallet af elever, hvis vækst faldt inden for et bestemt interval.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Det er selvfølgelig ikke alt, for der er meget flere formler i matematisk statistik. Vi har kun overvejet nogle grundlæggende begreber.

Distributionsplan

Fordelingsdiagrammer
Fordelingsdiagrammer

De grundlæggende begreber i matematisk statistik omfatter også en grafisk repræsentation af fordelingen, som er kendetegnet ved klarhed. Der er to typer grafer: polygon og histogram. Den første bruges til en diskret statistisk serie. Og til kontinuerlig distribution, henholdsvis den anden.

Anbefalede: