For at finde fordelingsfunktionerne for stokastiske variable og deres variabler er det nødvendigt at studere alle funktionerne i dette vidensfelt. Der er flere forskellige metoder til at finde de pågældende værdier, herunder at ændre en variabel og generere et moment. Distribution er et koncept baseret på elementer som spredning, variationer. De karakteriserer dog kun graden af spredningsamplitude.
De vigtigste funktioner af stokastiske variable er dem, der er relaterede og uafhængige og ligeligt fordelte. For eksempel, hvis X1 er vægten af et tilfældigt udvalgt individ fra en mandlig population, X2 er vægten af en anden, …, og Xn er vægten af en person mere fra den mandlige befolkning, så skal vi vide, hvordan den tilfældige funktion fungerer X er fordelt. I dette tilfælde gælder den klassiske sætning kaldet den centrale grænsesætning. Det giver dig mulighed for at vise, at for store n følger funktionen standardfordelinger.
Funktioner af én tilfældig variabel
The Central Limit Theorem er til tilnærmelse af diskrete værdier under overvejelse, såsom binomial og Poisson. Fordelingsfunktioner af tilfældige variable betragtes først og fremmest på simple værdier af en variabel. For eksempel, hvis X er en kontinuert stokastisk variabel med sin egen sandsynlighedsfordeling. I dette tilfælde undersøger vi, hvordan man finder tæthedsfunktionen af Y ved hjælp af to forskellige tilgange, nemlig fordelingsfunktionsmetoden og ændringen i variabel. For det første betragtes kun en-til-en værdier. Derefter skal du ændre teknikken til at ændre variablen for at finde dens sandsynlighed. Endelig skal vi lære, hvordan den inverse kumulative fordelingsfunktion kan hjælpe med at modellere tilfældige tal, der følger bestemte sekventielle mønstre.
Metode til distribution af betragtede værdier
Metoden til sandsynlighedsfordelingsfunktionen for en stokastisk variabel er anvendelig for at finde dens tæthed. Ved brug af denne metode beregnes en kumulativ værdi. Derefter kan du ved at differentiere den få sandsynlighedstætheden. Nu hvor vi har fordelingsfunktionsmetoden, kan vi se på et par flere eksempler. Lad X være en kontinuert stokastisk variabel med en vis sandsynlighedstæthed.
Hvad er sandsynlighedstæthedsfunktionen af x2? Hvis du ser på eller tegner funktionen (øverst og til højre) y \u003d x2, kan du bemærke, at det er et stigende X og 0 <y<1. Nu skal du bruge den overvejede metode til at finde Y. Først er den kumulative fordelingsfunktion fundet, du skal blot differentiere for at få sandsynlighedstætheden. Hvis du gør det, får vi: 0<y<1. Fordelingsmetoden er med succes implementeret til at finde Y, når Y er en stigende funktion af X. Forresten integreres f(y) i 1 over y.
I det sidste eksempel blev der brugt stor omhu på at indeksere de kumulative funktioner og sandsynlighedstæthed med enten X eller Y for at angive, hvilken tilfældig variabel de tilhørte. For eksempel, når vi fandt den kumulative fordelingsfunktion af Y, fik vi X. Hvis du skal finde en tilfældig variabel X og dens tæthed, skal du bare differentiere den.
Variabel ændringsteknik
Lad X være en kontinuert stokastisk variabel givet af en fordelingsfunktion med en fællesnævner f (x). I dette tilfælde, hvis du sætter værdien af y i X=v (Y), så får du værdien af x, for eksempel v (y). Nu skal vi få fordelingsfunktionen af en kontinuert stokastisk variabel Y. Hvor den første og anden lighed finder sted ud fra definitionen af kumulativ Y. Den tredje lighed gælder, fordi den del af funktionen, for hvilken u (X) ≦ y er også sandt, at X ≦ v (Y). Og det sidste er gjort for at bestemme sandsynligheden i en kontinuert stokastisk variabel X. Nu skal vi tage den afledede af FY (y), den kumulative fordelingsfunktion af Y, for at få sandsynlighedstætheden Y.
Generalisering for reduktionsfunktionen
Lad X være en kontinuerlig tilfældig variabel med fælles f (x) defineret over c1<x<c2. Og lad Y=u (X) være en aftagende funktion af X med invers X=v (Y). Da funktionen er kontinuerlig og aftagende, er der en invers funktion X=v (Y).
For at løse dette problem kan du indsamle kvantitative data og bruge den empiriske kumulative distributionsfunktion. Med disse oplysninger og appellerende til dem skal du kombinere midler, standardafvigelser, mediedata og så videre.
På samme måde kan selv en ret simpel probabilistisk model have et stort antal resultater. For eksempel hvis du slår en mønt 332 gange. Så er antallet af resultater opnået fra flip større end google (10100) - et tal, men ikke mindre end 100 kvintillioner gange højere end elementarpartikler i det kendte univers. Ikke interesseret i en analyse, der giver svar på alle mulige udfald. Et enklere koncept ville være nødvendigt, såsom antallet af hoveder eller det længste slag af halerne. For at fokusere på emner af interesse accepteres et specifikt resultat. Definitionen i dette tilfælde er som følger: en stokastisk variabel er en reel funktion med et sandsynlighedsrum.
Området S af en tilfældig variabel kaldes nogle gange tilstandsrummet. Hvis X er den pågældende værdi, så N=X2, exp ↵X, X2 + 1, tan2 X, bXc, og så videre. Den sidste af disse, afrunding af X til nærmeste hele tal, kaldes etagefunktionen.
Distributionsfunktioner
Når fordelingsfunktionen af interesse for en stokastisk variabel x er bestemt, bliver spørgsmålet norm alt: "Hvad er chancerne for, at X falder ind i en delmængde af B-værdier?". For eksempel, B={ulige tal}, B={større end 1} eller B={mellem 2 og 7} for at angive de resultater, der har X, værdientilfældig variabel, i delmængde A. I ovenstående eksempel kan du således beskrive begivenhederne som følger.
{X er et ulige tal}, {X er større end 1}={X> 1}, {X er mellem 2 og 7}={2 <X <7} for at matche de tre muligheder ovenfor for delmængde B. Mange egenskaber ved tilfældige størrelser er ikke relateret til et bestemt X. De afhænger snarere af, hvordan X allokerer dets værdier. Dette fører til en definition, der lyder sådan: fordelingsfunktionen af en stokastisk variabel x er kumulativ og bestemmes af kvantitative observationer.
Tilfældige variabler og fordelingsfunktioner
Du kan således beregne sandsynligheden for, at fordelingsfunktionen af en stokastisk variabel x vil tage værdier i intervallet ved subtraktion. Tænk på at inkludere eller ekskludere slutpunkter.
Vi kalder en tilfældig variabel diskret, hvis den har et endeligt eller tælleligt uendeligt tilstandsrum. X er således antallet af hoveder på tre uafhængige vendinger af en skæv mønt, der går op med sandsynlighed p. Vi skal finde den kumulative fordelingsfunktion af en diskret stokastisk variabel FX for X. Lad X være antallet af toppe i en samling af tre kort. Så Y=X3 via FX. FX starter ved 0, slutter ved 1 og falder ikke, når x-værdier stiger. Den kumulative FX-fordelingsfunktion af en diskret stokastisk variabel X er konstant, undtagen for spring. Når du hopper, er FX kontinuerlig. Bevis udsagnet om det rigtigekontinuiteten af fordelingsfunktionen fra sandsynlighedsegenskaben er mulig ved hjælp af definitionen. Det lyder sådan her: en konstant tilfældig variabel har en kumulativ FX, der kan differentieres.
For at vise, hvordan dette kan ske, kan vi give et eksempel: et mål med en enhedsradius. Formentlig. pilen er jævnt fordelt over det angivne område. For nogle λ> 0. Fordelingsfunktionerne af kontinuerte stokastiske variable stiger således jævnt. FX har egenskaberne som en distributionsfunktion.
En mand venter ved busstoppestedet, indtil bussen ankommer. Efter selv at have besluttet, at han vil nægte, når ventetiden når 20 minutter. Her er det nødvendigt at finde den kumulative fordelingsfunktion for T. Det tidspunkt, hvor en person stadig vil være på busstationen eller ikke vil forlade. På trods af at den kumulative fordelingsfunktion er defineret for hver stokastisk variabel. Alligevel vil andre karakteristika blive brugt ret ofte: massen for en diskret variabel og fordelingstæthedsfunktionen for en stokastisk variabel. Norm alt udlæses værdien gennem en af disse to værdier.
Massefunktioner
Disse værdier vurderes af følgende egenskaber, som har en generel (masse) karakter. Den første er baseret på, at sandsynligheden ikke er negative. Den anden følger af observationen, at mængden for alle x=2S, tilstandsrummet for X, danner en opdeling af den sandsynlige frihed for X. Eksempel: at kaste en skæv mønt, hvis udfald er uafhængige. Du kan blive ved med at gøre detvisse handlinger, indtil du får en rulle hoveder. Lad X betegne en tilfældig variabel, der giver antallet af haler foran det første hoved. Og p angiver sandsynligheden for en given handling.
Så massesandsynlighedsfunktionen har følgende karakteristiske træk. Fordi udtrykkene danner en numerisk sekvens, kaldes X en geometrisk tilfældig variabel. Geometrisk skema c, cr, cr2,.,,, crn har en sum. Og derfor har sn en grænse som n 1. I dette tilfælde er den uendelige sum grænsen.
Massefunktionen ovenfor danner en geometrisk sekvens med et forhold. Derfor er naturlige tal a og b. Forskellen i værdierne i fordelingsfunktionen er lig med værdien af massefunktionen.
Densitetsværdierne, der overvejes, har en definition: X er en tilfældig variabel, hvis FX-fordeling har en afledt. FX, der opfylder Z xFX (x)=fX (t) dt-1 kaldes sandsynlighedsdensitetsfunktionen. Og X kaldes en kontinuert stokastisk variabel. I den grundlæggende sætning af calculus er tæthedsfunktionen den afledte af fordelingen. Du kan beregne sandsynligheder ved at beregne bestemte integraler.
Fordi data indsamles fra flere observationer, skal mere end én tilfældig variabel ad gangen tages i betragtning for at modellere de eksperimentelle procedurer. Derfor betyder sættet af disse værdier og deres fælles fordeling for de to variable X1 og X2 visning af begivenheder. For diskrete stokastiske variable defineres fælles sandsynlighedsmassefunktioner. For kontinuerlige betragtes fX1, X2, hvorsamlingssandsynlighedstætheden er opfyldt.
Uafhængige tilfældige variable
To tilfældige variable X1 og X2 er uafhængige, hvis to hændelser forbundet med dem er ens. Med ord er sandsynligheden for, at to hændelser {X1 2 B1} og {X2 2 B2} forekommer på samme tid, y, lig med produktet af variablerne ovenfor, at hver af dem opstår individuelt. For uafhængige diskrete stokastiske variable er der en fælles probabilistisk massefunktion, som er produktet af det begrænsende ionvolumen. For kontinuerte stokastiske variable, der er uafhængige, er den fælles sandsynlighedstæthedsfunktion produktet af marginaldensitetsværdierne. Til sidst betragter vi n uafhængige observationer x1, x2,.,,, xn hidrørende fra en ukendt tæthed eller massefunktion f. For eksempel fungerer en ukendt parameter i en eksponentiel stokastisk variabel, der beskriver ventetiden for en bus.
Imitation af tilfældige variable
Hovedmålet med dette teoretiske felt er at give de nødvendige værktøjer til at udvikle slutningsprocedurer baseret på sunde statistiske videnskabelige principper. En meget vigtig use case for software er således evnen til at generere pseudodata for at efterligne faktisk information. Dette gør det muligt at teste og forbedre analysemetoder, før de skal bruges i rigtige databaser. Dette er nødvendigt for at udforske dataenes egenskaber igennemmodellering. For mange almindeligt anvendte familier af tilfældige variabler giver R kommandoer til at generere dem. Under andre omstændigheder vil der være behov for metoder til modellering af en sekvens af uafhængige stokastiske variable, der har en fælles fordeling.
Diskrete tilfældige variabler og kommandomønster. Prøvekommandoen bruges til at skabe enkle og stratificerede tilfældige prøver. Som et resultat heraf, hvis en sekvens x er input, vælger sample(x, 40) 40 poster fra x, således at alle valg af størrelse 40 har samme sandsynlighed. Dette bruger standard R-kommandoen til hentning uden erstatning. Kan også bruges til at modellere diskrete tilfældige variable. For at gøre dette skal du angive et tilstandsrum i vektoren x og massefunktionen f. Et kald til erstatning=TRUE angiver, at prøvetagning sker med erstatning. For derefter at give en stikprøve af n uafhængige stokastiske variable, der har en fælles massefunktion f, bruges stikprøven (x, n, replace=TRUE, prob=f).
Bedømt, at 1 er den mindste værdi, der er repræsenteret, og 4 er den største af alle. Hvis kommandoen prob=f udelades, vil prøven sample ensartet fra værdierne i vektor x. Du kan kontrollere simuleringen i forhold til massefunktionen, der genererede dataene, ved at se på det dobbelte lighedstegnet,==. Og genberegning af de observationer, der tager enhver mulig værdi for x. Du kan lave et bord. Gentag dette for 1000 og sammenlign simuleringen med den tilsvarende massefunktion.
Illustration af sandsynlighedstransformation
Førstsimulere homogene fordelingsfunktioner af stokastiske variable u1, u2,.,,, un på intervallet [0, 1]. Cirka 10 % af tallene skal være inden for [0, 3, 0, 4]. Dette svarer til 10 % af simuleringerne på intervallet [0, 28, 0, 38] for en stokastisk variabel med FX-fordelingsfunktionen vist. Tilsvarende bør omkring 10 % af de tilfældige tal være i intervallet [0, 7, 0, 8]. Dette svarer til 10 % simuleringer på intervallet [0, 96, 1, 51] af den stokastiske variabel med fordelingsfunktionen FX. Disse værdier på x-aksen kan opnås ved at tage det omvendte fra FX. Hvis X er en kontinuert stokastisk variabel med tæthed fX positiv over alt i sit domæne, så er fordelingsfunktionen strengt stigende. I dette tilfælde har FX en invers FX-1 funktion kendt som kvantilfunktionen. FX (x) u kun når x FX-1 (u). Sandsynlighedstransformationen følger af analysen af den stokastiske variabel U=FX (X).
FX har et interval på 0 til 1. Det kan ikke være under 0 eller over 1. For værdier af u mellem 0 og 1. Hvis U kan simuleres, skal en stokastisk variabel med FX-fordeling være simuleret via en kvantilfunktion. Tag den afledede for at se, at tætheden u varierer inden for 1. Da den stokastiske variabel U har en konstant tæthed over intervallet af dens mulige værdier, kaldes den ensartet på intervallet [0, 1]. Den er modelleret i R med kommandoen runif. Identiteten kaldes en probabilistisk transformation. Du kan se, hvordan det virker i dartskiveeksemplet. X mellem 0 og 1, funktionfordeling u=FX (x)=x2, og dermed kvantilfunktionen x=FX-1 (u). Det er muligt at modellere uafhængige observationer af afstanden fra midten af dartpanelet, og dermed skabe ensartede stokastiske variable U1, U2,.,, Un. Fordelingsfunktionen og den empiriske funktion er baseret på 100 simuleringer af fordelingen af en dartskive. For en eksponentiel stokastisk variabel, formodentlig u=FX (x)=1 - exp (- x), og dermed x=- 1 ln (1 - u). Nogle gange består logik af tilsvarende udsagn. I dette tilfælde skal du sammenkæde de to dele af argumentet. Skæringsidentiteten er ens for alle 2 {S i i} S, i stedet for en eller anden værdi. Unionen Ci er lig med tilstandsrummet S, og hvert par udelukker hinanden. Da Bi - er opdelt i tre aksiomer. Hver kontrol er baseret på den tilsvarende sandsynlighed P. For enhver delmængde. Brug af en identitet for at sikre, at svaret ikke afhænger af, om intervalendepunkterne er inkluderet.
Eksponentiel funktion og dens variabler
For hvert udfald i alle hændelser bruges den anden egenskab for kontinuiteten af sandsynligheder i sidste ende, som anses for aksiomatisk. Loven om fordelingen af funktionen af en stokastisk variabel her viser, at hver har sin egen løsning og svar.