Bayesianske netværk: definition, eksempler og hvordan de fungerer

Indholdsfortegnelse:

Bayesianske netværk: definition, eksempler og hvordan de fungerer
Bayesianske netværk: definition, eksempler og hvordan de fungerer
Anonim

Et tros-, beslutningsnetværk, Bayesiansk (ian) model eller sandsynlighedsdrevet acyklisk grafmodel er et variantskema (en type statistisk model), der repræsenterer et sæt variabler og deres betingede afhængigheder gennem en rettet acyklisk graf (DAG)).

For eksempel kan et bayesiansk netværk repræsentere sandsynlige sammenhænge mellem sygdomme og symptomer. Givet sidstnævnte kan netværket bruges til at beregne muligheden for at have forskellige sygdomme. I videoen nedenfor kan du se et eksempel på et Bayesiansk trosnetværk med beregninger.

Image
Image

Effektivitet

Effektive algoritmer kan udføre inferens og læring på Bayesianske netværk. Netværk, der modellerer variabler (såsom talesignaler eller proteinsekvenser), kaldes dynamiske netværk. Generaliseringer af Bayesianske netværk, der kan repræsentere og løse problemer under usikkerhed, kaldes indflydelsesdiagrammer.

Essence

FormeltBayesianske netværk er DAG'er, hvis noder repræsenterer variabler i Bayesiansk forstand: de kan være observerede værdier, skjulte variabler, ukendte parametre eller hypoteser. Fordi det er meget interessant.

bayesiansk netværkseksempel

To begivenheder kan få græsset til at blive vådt: en aktiv sprinkler eller regn. Regn har en direkte effekt på brugen af sprinkleren (nemlig at når det regner, er sprinkleren norm alt inaktiv). Denne situation kan modelleres ved hjælp af et Bayesiansk netværk.

Typisk formel
Typisk formel

Simulering

Fordi det Bayesianske netværk er en komplet model for dets variabler og deres relationer, kan det bruges til at besvare sandsynlighedsspørgsmål om dem. For eksempel kan det bruges til at opdatere viden om tilstanden af en delmængde af variabler, når andre data (evidensvariable) observeres. Denne interessante proces kaldes probabilistisk inferens.

A posteriori giver en universelt tilstrækkelig statistik til opdagelsesapplikationer, når der vælges værdier for en delmængde af variable. Denne algoritme kan således betragtes som en mekanisme til automatisk at anvende Bayes' sætning på komplekse problemer. På billederne i artiklen kan du se eksempler på Bayesianske trosnetværk.

Praktisk Bayesiansk netværk
Praktisk Bayesiansk netværk

Outputmetoder

De mest almindelige eksakte inferensmetoder er: variabel eliminering, som eliminerer (ved integration eller summering) det uobserverbareikke-forespørgselsparametre én efter én ved at allokere beløbet til produktet.

Klikudbredelse af et "træ", der cacher beregninger, så mange variabler kan forespørges på én gang, og nye beviser kan udbredes hurtigt; og rekursiv matchning og/eller søgning, som tillader afvejninger mellem rum og tid og matcher effektiviteten af variabel eliminering, når der bruges nok plads.

Alle disse metoder har en særlig kompleksitet, der afhænger eksponentielt af længden af netværket. De mest almindelige tilnærmede inferensalgoritmer er minisegmenteliminering, cyklisk trosudbredelse, generaliseret trosudbredelse og variationsmetoder.

Typer af netværk
Typer af netværk

Netværk

For fuldt ud at specificere det bayesianske netværk og således fuldt ud repræsentere den fælles sandsynlighedsfordeling, er det nødvendigt at specificere for hver knude X sandsynlighedsfordelingen for X på grund af forældrene til X.

Fordelingen af X betinget af dets forældre kan have enhver form. Det er almindeligt at arbejde med diskrete eller gaussiske fordelinger, da det forenkler beregninger. Nogle gange kendes kun distributionsbegrænsninger. Du kan derefter bruge entropi til at bestemme den enkelte fordeling, der har den højeste entropi givet begrænsningerne.

På samme måde, i den specifikke kontekst af et dynamisk Bayesiansk netværk, den betingede fordeling for den tidsmæssige udvikling af det latentetilstand er norm alt indstillet til at maksimere entropihastigheden af den implicitte tilfældige proces.

Bayesiansk tillidsnet
Bayesiansk tillidsnet

Direkte maksimering af sandsynlighed (eller posterior sandsynlighed) er ofte vanskelig på grund af tilstedeværelsen af uobserverede variable. Dette gælder især for et Bayesiansk beslutningsnetværk.

Klassisk tilgang

Den klassiske tilgang til dette problem er forventningsmaksimeringsalgoritmen, som skifter beregning af de forventede værdier af uobserverede variabler afhængige af de observerede data med maksimering af den samlede sandsynlighed (eller posterior værdi), idet det antages, at den tidligere beregnede forventede værdi værdier er korrekte. Under forhold med moderat regelmæssighed konvergerer denne proces i de maksimale (eller maksimale a posteriori) værdier for parametrene.

En mere komplet Bayesiansk tilgang til parametre er at behandle dem som yderligere uobserverede variable og beregne den fulde posteriore fordeling over alle noder givet de observerede data, og derefter integrere parametrene. Denne tilgang kan være dyr og resultere i store modeller, hvilket gør klassiske parameterjusteringstilgange mere tilgængelige.

I det enkleste tilfælde defineres et Bayesiansk netværk af en ekspert og bruges derefter til at udføre inferens. I andre applikationer er opgaven med at bestemme for svær for et menneske. I dette tilfælde skal strukturen af det Bayesianske neurale netværk og parametrene for lokale distributioner læres blandt dataene.

Bayesianske netværk
Bayesianske netværk

Alternativ metode

En alternativ metode til struktureret læring bruger optimeringssøgning. Dette kræver anvendelse af en evalueringsfunktion og en søgestrategi. En almindelig scoringsalgoritme er den bageste sandsynlighed for en struktur givet træningsdata såsom BIC eller BDeu.

Den tid, der kræves for en udtømmende søgning, der returnerer en struktur, der maksimerer scoren, er supereksponentiel i antallet af variable. Den lokale søgestrategi foretager trinvise ændringer for at forbedre strukturestimeringen. Friedman og hans kolleger overvejede at bruge gensidig information mellem variabler for at finde den ønskede struktur. De begrænser sættet af forældrekandidater til k noder og søger dem grundigt.

En særlig hurtig metode til at studere BN præcist er at forestille sig problemet som et optimeringsproblem og løse det ved hjælp af heltalsprogrammering. Acyklicitetsbegrænsninger tilføjes til heltalsprogrammet (IP) under løsning i form af skæreplaner. En sådan metode kan håndtere problemer op til 100 variabler.

Grafer og netværk
Grafer og netværk

Problemløsning

For at løse problemer med tusindvis af variabler er en anden tilgang nødvendig. Den ene er først at vælge én ordre og derefter finde den optimale BN-struktur i forhold til den ordre. Dette indebærer at arbejde i søgerummet for mulig bestilling, hvilket er praktisk, fordi det er mindre end rummet af netværksstrukturer. Derefter udvælges og evalueres flere ordrer. Denne metode viste sigbedst tilgængelige i litteraturen, når antallet af variabler er enormt.

En anden metode er at fokusere på en underklasse af nedbrydelige modeller, for hvilke MLE'er er lukkede. Så kan du finde en ensartet struktur for hundredvis af variabler.

At studere Bayesianske netværk med en begrænset bredde på tre linjer er nødvendigt for at give nøjagtig, fortolkelig slutning, da sidstnævntes værst tænkelige kompleksitet er eksponentiel i trælængde k (ifølge den eksponentielle tidshypotese). Som en global egenskab ved grafen øger den imidlertid kompleksiteten af læreprocessen. I denne sammenhæng kan K-tree bruges til effektiv læring.

Kort netværk
Kort netværk

Udvikling

Udvikling af et Bayesian Web of Trust begynder ofte med oprettelsen af en DAG G, således at X opfylder en lokal Markov-ejendom med hensyn til G. Nogle gange er dette en kausal DAG. Der estimeres de betingede sandsynlighedsfordelinger af hver variabel over dens forældre i G. I mange tilfælde, især når variablerne er diskrete, hvis den fælles fordeling af X er produktet af disse betingede fordelinger, så bliver X et Bayesiansk netværk mht. G.

Markovs "knudetæppe" er et sæt knob. Markov-dynen gør noden uafhængig af resten af blanken i noden med samme navn og er tilstrækkelig viden til at beregne dens fordeling. X er et Bayesiansk netværk med hensyn til G, hvis hver knude er betinget uafhængig af alle andre knudepunkter, givet dens Markoviantæppe.

Anbefalede: