Lar Desenvolvimento O que é um processo de decisão markov (mdp)? - o que é techopedia

O que é um processo de decisão markov (mdp)? - o que é techopedia

Índice:

Anonim

Definição - O que significa Markov Decision Process (MDP)?

Um processo de decisão de Markov (MDP) é algo que os profissionais chamam de "processo discreto de controle estocástico do tempo". É baseado em matemática pioneira pelo acadêmico russo Andrey Markov no final do século XIX e início do século XX.

Techopedia explica Processo de Decisão Markov (MDP)

Uma maneira de explicar um processo de decisão de Markov e as cadeias de Markov associadas é que esses são elementos da teoria moderna dos jogos baseada em pesquisas matemáticas mais simples feitas pelo cientista russo há centenas de anos. A descrição de um processo de decisão de Markov é que ele estuda um cenário em que um sistema está em um determinado conjunto de estados e avança para outro estado com base nas decisões de um tomador de decisão.

Uma cadeia de Markov como modelo mostra uma sequência de eventos em que a probabilidade de um determinado evento depende de um estado atingido anteriormente. Os profissionais podem falar sobre um “espaço de estado contável” na descrição do processo de decisão de Markov - alguns associam a ideia do modelo de decisão de Markov a um modelo de “passeio aleatório” ou outro modelo estocástico baseado em probabilidades (o modelo de passeio aleatório, frequentemente citado em Wall Street, modela o movimento de um patrimônio para cima ou para baixo em um contexto de probabilidade de mercado).

Em geral, os processos de decisão de Markov são frequentemente aplicados a algumas das tecnologias mais sofisticadas em que os profissionais estão trabalhando atualmente, por exemplo, em robótica, automação e modelos de pesquisa.

O que é um processo de decisão markov (mdp)? - o que é techopedia