Índice:
- Definição - O que significa Markov Decision Process (MDP)?
- Techopedia explica Processo de Decisão Markov (MDP)
Definição - O que significa Markov Decision Process (MDP)?
Um processo de decisão de Markov (MDP) é algo que os profissionais chamam de "processo discreto de controle estocástico do tempo". É baseado em matemática pioneira pelo acadêmico russo Andrey Markov no final do século XIX e início do século XX.
Techopedia explica Processo de Decisão Markov (MDP)
Uma maneira de explicar um processo de decisão de Markov e as cadeias de Markov associadas é que esses são elementos da teoria moderna dos jogos baseada em pesquisas matemáticas mais simples feitas pelo cientista russo há centenas de anos. A descrição de um processo de decisão de Markov é que ele estuda um cenário em que um sistema está em um determinado conjunto de estados e avança para outro estado com base nas decisões de um tomador de decisão.
Uma cadeia de Markov como modelo mostra uma sequência de eventos em que a probabilidade de um determinado evento depende de um estado atingido anteriormente. Os profissionais podem falar sobre um “espaço de estado contável” na descrição do processo de decisão de Markov - alguns associam a ideia do modelo de decisão de Markov a um modelo de “passeio aleatório” ou outro modelo estocástico baseado em probabilidades (o modelo de passeio aleatório, frequentemente citado em Wall Street, modela o movimento de um patrimônio para cima ou para baixo em um contexto de probabilidade de mercado).
Em geral, os processos de decisão de Markov são frequentemente aplicados a algumas das tecnologias mais sofisticadas em que os profissionais estão trabalhando atualmente, por exemplo, em robótica, automação e modelos de pesquisa.