Hjem Lyd Hvad er delvist observerbar markov-beslutningsproces (pomdp)? - definition fra techopedia

Hvad er delvist observerbar markov-beslutningsproces (pomdp)? - definition fra techopedia

Indholdsfortegnelse:

Anonim

Definition - Hvad betyder delvist observerbar Markov-beslutningsproces (POMDP)?

En delvist observerbar Markov-beslutningsproces (POMPD) er en Markov-beslutningsproces, hvor agenten ikke direkte kan observere de underliggende tilstande i modellen. Markov-beslutningsprocessen (MDP) er en matematisk ramme for modellering af beslutninger, der viser et system med en række stater og leverer handlinger til beslutningstageren baseret på disse stater.

POMPD bygger videre på dette koncept for at vise, hvordan et system kan håndtere udfordringerne ved begrænset observation.

Techopedia forklarer delvist observerbar Markov-beslutningsproces (POMDP)

I den delvist observerbare Markov-beslutningsproces, fordi de underliggende stater ikke er gennemsigtige for agenten, er et begreb kaldet en ”tro-tilstand” nyttigt. Troenstilstanden giver en måde at håndtere tvetydigheden i modellen.

POMPD er nyttig i forstærkningslæring, hvor et system kan gå over MPD- eller POMPD-modellen ved hjælp af det, der vides for at skabe et klarere billede af sandsynlighedsresultater.

Hvad er delvist observerbar markov-beslutningsproces (pomdp)? - definition fra techopedia