Hjem Udvikling Hvad er en markov-beslutningsproces (mdp)? - definition fra techopedia

Hvad er en markov-beslutningsproces (mdp)? - definition fra techopedia

Indholdsfortegnelse:

Anonim

Definition - Hvad betyder Markov Decision Process (MDP)?

En Markov-beslutningsproces (MDP) er noget, som fagfolk refererer til som en "diskret tid-stokastisk kontrolproces." Den er baseret på matematik, der var pioner for den russiske akademiske Andrey Markov i slutningen af ​​det 19. og det tidlige 20. århundrede.

Techopedia forklarer Markov Decision Process (MDP)

En måde at forklare en Markov-beslutningsproces og tilknyttede Markov-kæder er, at dette er elementer i moderne spilteori, der var baseret på en enklere matematisk forskning fra den russiske videnskabsmand for hundrede år siden. Beskrivelsen af ​​en Markov-beslutningsproces er, at den studerer et scenarie, hvor et system er i et givet sæt af stater, og bevæger sig videre til en anden stat baseret på beslutningstagernes beslutninger.

En Markov-kæde som model viser en sekvens af begivenheder, hvor sandsynligheden for en given begivenhed afhænger af en tidligere opnået tilstand. Fagfolk taler muligvis om et "tællbart tilstandsrum" i beskrivelsen af ​​Markovs beslutningsproces - nogle forbinder ideen om Markov-beslutningsmodellen med en "tilfældig gåtur" -model eller anden stokastisk model baseret på sandsynligheder (den tilfældige gangmodel, ofte citeret på Wall Street, modellerer bevægelsen af ​​en egenkapital op eller ned i en markedssandsynlighedskontekst).

Generelt anvendes Markov-beslutningsprocesser ofte på nogle af de mest sofistikerede teknologier, som fagfolk arbejder på i dag, for eksempel inden for robotik, automatisering og forskningsmodeller.

Hvad er en markov-beslutningsproces (mdp)? - definition fra techopedia