Bayesianska nätverk: definition, exempel och hur de fungerar

Innehållsförteckning:

Bayesianska nätverk: definition, exempel och hur de fungerar
Bayesianska nätverk: definition, exempel och hur de fungerar
Anonim

Ett tros-, beslutsnätverk, Bayesiansk (ian) modell eller probabilistiskt driven acyklisk grafmodell är ett variantschema (en typ av statistisk modell) som representerar en uppsättning variabler och deras villkorliga beroenden genom en riktad acyklisk graf (DAG)).

Till exempel kan ett Bayesianskt nätverk representera probabilistiska samband mellan sjukdomar och symtom. Givet det senare kan nätverket användas för att beräkna möjligheten att ha olika sjukdomar. I videon nedan kan du se ett exempel på ett Bayesianskt trosnätverk med beräkningar.

Image
Image

Effektivitet

Effektiva algoritmer kan utföra slutledning och inlärning på Bayesianska nätverk. Nätverk som modellerar variabler (som talsignaler eller proteinsekvenser) kallas dynamiska nätverk. Generaliseringar av Bayesianska nätverk som kan representera och lösa problem under osäkerhet kallas inflytandediagram.

Essence

FormelltBayesianska nätverk är DAG vars noder representerar variabler i Bayesiansk mening: de kan vara observerade värden, dolda variabler, okända parametrar eller hypoteser. För det är väldigt intressant.

bayesiskt nätverksexempel

Två händelser kan göra att gräset blir blött: en aktiv sprinkler eller regn. Regn har en direkt effekt på användningen av sprinklern (nämligen att när det regnar är sprinklern vanligtvis inaktiv). Denna situation kan modelleras med hjälp av ett Bayesianskt nätverk.

Typisk formel
Typisk formel

Simulering

Eftersom det Bayesianska nätverket är en komplett modell för dess variabler och deras relationer, kan det användas för att svara på sannolikhetsfrågor om dem. Till exempel kan den användas för att uppdatera kunskap om tillståndet för en delmängd av variabler när andra data (evidensvariabler) observeras. Denna intressanta process kallas probabilistisk slutledning.

A posteriori ger en universellt tillräcklig statistik för upptäcktsapplikationer när man väljer värden för en undergrupp av variabler. Således kan denna algoritm betraktas som en mekanism för att automatiskt tillämpa Bayes teorem på komplexa problem. På bilderna i artikeln kan du se exempel på Bayesianska trosnätverk.

Praktiskt Bayesianskt nätverk
Praktiskt Bayesianskt nätverk

Utdatametoder

De vanligaste exakta slutledningsmetoderna är: variabel eliminering, som eliminerar (genom integration eller summering) det oobserverbaraicke-frågeparametrar en efter en genom att allokera beloppet till produkten.

Klickförökning av ett "träd" som cachar beräkningar så att många variabler kan frågas samtidigt och nya bevis kan spridas snabbt; och rekursiv matchning och/eller sökning, som tillåter avvägningar mellan rum och tid och matchar effektiviteten av variabel eliminering när tillräckligt med utrymme används.

Alla dessa metoder har en speciell komplexitet som beror exponentiellt på nätverkets längd. De vanligaste ungefärliga slutledningsalgoritmerna är eliminering av minisegment, cyklisk trosutbredning, generaliserad trosutbredning och variationsmetoder.

Typer av nätverk
Typer av nätverk

Nätverk

För att helt och hållet specificera det bayesianska nätverket och därmed fullt ut representera den gemensamma sannolikhetsfördelningen, är det nödvändigt att för varje nod X specificera sannolikhetsfördelningen för X på grund av föräldrarna till X.

Fördelningen av X villkorligt av dess föräldrar kan ha vilken form som helst. Det är vanligt att arbeta med diskreta eller gaussiska fördelningar då det förenklar beräkningar. Ibland är bara distributionsbegränsningar kända. Du kan sedan använda entropi för att bestämma den enstaka fördelningen som har den högsta entropin givet begränsningarna.

På liknande sätt, i det specifika sammanhanget för ett dynamiskt Bayesian-nätverk, den villkorliga distributionen för den tidsmässiga utvecklingen av det latentatillstånd är vanligtvis inställt för att maximera entropihastigheten för den implicita slumpmässiga processen.

Bayesianskt förtroendenät
Bayesianskt förtroendenät

Direkt maximering av sannolikhet (eller posterior sannolikhet) är ofta knepigt med tanke på närvaron av oobserverade variabler. Detta gäller särskilt för ett Bayesianskt beslutsnätverk.

Klassiskt tillvägagångssätt

Det klassiska tillvägagångssättet för detta problem är förväntningsmaximeringsalgoritmen, som alternerar beräkning av förväntade värden för oobserverade variabler beroende på observerade data med maximering av den totala sannolikheten (eller det bakre värdet), förutsatt att det tidigare beräknade förväntade värdet värdena är korrekta. Under förhållanden med måttlig regelbundenhet konvergerar denna process i parametrarnas maximala (eller maximala a posteriori) värden.

En mer komplett Bayesiansk metod för parametrar är att behandla dem som ytterligare oobserverade variabler och beräkna den fullständiga bakre fördelningen över alla noder givet de observerade data, och sedan integrera parametrarna. Detta tillvägagångssätt kan vara kostsamt och resultera i stora modeller, vilket gör klassiska tillvägagångssätt för parameterjustering mer tillgängliga.

I det enklaste fallet definieras ett Bayesiskt nätverk av en expert och används sedan för att utföra slutledning. I andra applikationer är uppgiften att bestämma för svår för en människa. I det här fallet måste strukturen för det bayesianska neurala nätverket och parametrarna för lokala distributioner läras in bland data.

Bayesianska nätverk
Bayesianska nätverk

Alternativ metod

En alternativ metod för strukturerat lärande använder optimeringssökning. Detta kräver tillämpning av en utvärderingsfunktion och en sökstrategi. En vanlig poängalgoritm är den bakre sannolikheten för en struktur givet träningsdata som BIC eller BDeu.

Tiden som krävs för en uttömmande sökning som returnerar en struktur som maximerar poängen är superexponentiell i antalet variabler. Den lokala sökstrategin gör stegvisa ändringar för att förbättra strukturuppskattningen. Friedman och hans kollegor övervägde att använda ömsesidig information mellan variabler för att hitta den önskade strukturen. De begränsar uppsättningen föräldrakandidater till k noder och söker igenom dem noggrant.

En särskilt snabb metod för att studera BN exakt är att föreställa sig problemet som ett optimeringsproblem och lösa det med heltalsprogrammering. Acyklicitetsbegränsningar läggs till heltalsprogrammet (IP) under lösningen i form av skärplan. En sådan metod kan hantera problem med upp till 100 variabler.

Grafer och nätverk
Grafer och nätverk

Problemlösning

För att lösa problem med tusentals variabler behövs ett annat tillvägagångssätt. En är att först välja en order och sedan hitta den optimala BN-strukturen med avseende på den ordern. Detta innebär att man arbetar i sökutrymmet för möjlig ordning, vilket är bekvämt eftersom det är mindre än utrymmet för nätverksstrukturer. Flera beställningar väljs sedan ut och utvärderas. Denna metod visade sigbäst tillgängliga i litteraturen när antalet variabler är enormt.

En annan metod är att fokusera på en underklass av nedbrytbara modeller för vilka MLE är stängda. Då kan du hitta en konsekvent struktur för hundratals variabler.

Att studera Bayesianska nätverk med en begränsad bredd på tre linjer är nödvändigt för att ge korrekt, tolkbar slutledning, eftersom den värsta tänkbara komplexiteten hos de senare är exponentiell i trädlängden k (enligt den exponentiella tidshypotesen). Men som en global egenskap hos grafen ökar den avsevärt komplexiteten i inlärningsprocessen. I detta sammanhang kan K-tree användas för effektiv inlärning.

Kort nätverk
Kort nätverk

Utveckling

Utvecklingen av en Bayesian Web of Trust börjar ofta med skapandet av en DAG G så att X tillfredsställer en lokal Markov-egenskap med avseende på G. Ibland är detta en kausal DAG. De villkorade sannolikhetsfördelningarna för varje variabel över dess föräldrar i G uppskattas. I många fall, i synnerhet när variablerna är diskreta, om den gemensamma fördelningen av X är produkten av dessa villkorsfördelningar, så blir X ett Bayesianskt nätverk med avseende på G.

Markovs "knutfilt" är en uppsättning knutar. Markov-täcket gör noden oberoende av resten av blanketten i noden med samma namn och har tillräcklig kunskap för att beräkna dess fördelning. X är ett Bayesianskt nätverk med avseende på G om varje nod är villkorligt oberoende av alla andra noder, givet dess Markovianfilt.

Rekommenderad: