Indholdsfortegnelse:
- Definition - Hvad betyder Markov Decision Process (MDP)?
- Techopedia forklarer Markov Decision Process (MDP)
Definition - Hvad betyder Markov Decision Process (MDP)?
En Markov-beslutningsproces (MDP) er noget, som fagfolk refererer til som en "diskret tid-stokastisk kontrolproces." Den er baseret på matematik, der var pioner for den russiske akademiske Andrey Markov i slutningen af det 19. og det tidlige 20. århundrede.
Techopedia forklarer Markov Decision Process (MDP)
En måde at forklare en Markov-beslutningsproces og tilknyttede Markov-kæder er, at dette er elementer i moderne spilteori, der var baseret på en enklere matematisk forskning fra den russiske videnskabsmand for hundrede år siden. Beskrivelsen af en Markov-beslutningsproces er, at den studerer et scenarie, hvor et system er i et givet sæt af stater, og bevæger sig videre til en anden stat baseret på beslutningstagernes beslutninger.
En Markov-kæde som model viser en sekvens af begivenheder, hvor sandsynligheden for en given begivenhed afhænger af en tidligere opnået tilstand. Fagfolk taler muligvis om et "tællbart tilstandsrum" i beskrivelsen af Markovs beslutningsproces - nogle forbinder ideen om Markov-beslutningsmodellen med en "tilfældig gåtur" -model eller anden stokastisk model baseret på sandsynligheder (den tilfældige gangmodel, ofte citeret på Wall Street, modellerer bevægelsen af en egenkapital op eller ned i en markedssandsynlighedskontekst).
Generelt anvendes Markov-beslutningsprocesser ofte på nogle af de mest sofistikerede teknologier, som fagfolk arbejder på i dag, for eksempel inden for robotik, automatisering og forskningsmodeller.
