¿Cuál es la diferencia entre los modelos de cadena de markov y el modelo de markov oculto? He leído en Wikipedia, pero no pude entender las diferencias.¿Cuál es la diferencia entre las cadenas de markov y el modelo de markov oculto?
Respuesta
Para explicar por ejemplo, usaré un ejemplo del procesamiento de lenguaje natural. Imagine que quiere conocer la probabilidad de esta frase:
que disfrutar de un café
En un modelo de Markov, se puede estimar su probabilidad mediante el cálculo:
P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)
Ahora, imagina que queríamos conocer las etiquetas de partes de discurso de esta oración, es decir, si una palabra es un verbo en tiempo pasado, un sustantivo, etc.
No lo hicimos observe cualquier parte-de-sp etiquetas eech en esa oración, pero nosotros asumimos que están allí. Por lo tanto, calculamos cuál es la probabilidad de la secuencia de etiqueta de partes de discurso. En nuestro caso, la secuencia real es:
PRP-VBP-NN
Pero espera! Esta es una secuencia a la que podemos aplicarle un modelo de Markov. Pero lo llamamos oculto, ya que la secuencia de partes de discurso nunca se observa directamente. Por supuesto, en la práctica, calcularemos muchas de esas secuencias y nos gustaría encontrar la secuencia oculta que mejor explica nuestra observación (por ejemplo, es más probable que veamos palabras como 'the', 'this', generadas a partir del determinador (DET etiqueta))
La mejor explicación que he encontrado es en un documento de 1989 por Lawrence R. Rabiner: http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf
Un modelo oculto de Markov es un proceso estocástico doble incrustado con dos niveles.
El nivel superior es un proceso de Markov y los estados son inobservables.
De hecho, la observación es una función probabilística del nivel superior que afirma Markov.
Los diferentes estados de Markov tendrán diferentes funciones probabilísticas de observación.
Modelo de Markov es una máquina de estado con los cambios de estado son probabilidades. En un modelo oculto de Markov, no conoces las probabilidades, pero conoces los resultados.
Por ejemplo, cuando lanza una moneda, puede obtener las probabilidades, pero, si no puede ver los volteos y alguien mueve uno de los cinco dedos con cada lanzamiento de moneda, puede tomar los movimientos de los dedos y usar una modelo oculto de Markov para obtener la mejor estimación de los lanzamientos de monedas.
desde Matt utiliza etiquetas partes-de-voz como un ejemplo HMM, podría añadir una más ejemplo: reconocimiento de voz. Casi todos los sistemas de reconocimiento de voz continuo de gran vocabulario (LVCSR) se basan en HMM.
"ejemplo de Matt": que disfrutar de un café
En un modelo de Markov, se podía estimar su probabilidad mediante el cálculo:
P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)
En un modelo oculto de Markov,
Digamos que 30 personas diferentes leen la oración "I disfruta abrazando " y tenemos que reconocerlo. Cada persona pronunciará esta oración de manera diferente. Entonces NO sabemos si la persona quiso decir "abrazar" o "acaparar". Solo tendremos la distribución probabilística de la palabra real.
En resumen, un modelo de Markov oculto es un modelo estadístico de Markov en el que se supone que el sistema que se está modelando es un proceso de Markov con estados no ocultos (ocultos).
- 1. umbral de modelo de markov oculto
- 2. Modelo oculto de Markov que predice la siguiente observación
- 3. Modelo oculto de Markov para dados de tres lados
- 4. Markov proceso de toma
- 5. Paquete de estadísticas Java? (Cadenas de Markov y distribuciones avanzadas)
- 6. Markov Chain Text Generation
- 7. ¿Cuál es la diferencia entre el algoritmo de avance hacia atrás y el algoritmo de Viterbi?
- 8. ¿Algún ejemplo de negocios del uso de cadenas de Markov?
- 9. Markov algoritmo de clústeres de
- 10. Hidden Markov Models
- 11. Cadena gráfica de markov en javascript
- 12. ¿Cuál es la mejor forma de calcular la matriz fundamental de una cadena de Markov absorbente?
- 13. Modelos Ocultos de Markov con C++
- 14. Cadena de Markov simple en R (visualización)
- 15. ¿Se implementan Markov Random Fields en OpenCV?
- 16. cuál es la diferencia entre las plantillas y el polimorfismo
- 17. ¿Cuáles son las formas de decidir las probabilidades en modelos ocultos de Markov?
- 18. Algoritmos para identificar el contenido generado por Markov
- 19. Biblioteca R para simulación discreta de cadena de Markov
- 20. ¿Cuál es la diferencia entre cadenas de C y cadenas de C++?
- 21. Usar cadenas de Markov (o algo similar) para producir un IRC-bot
- 22. Cómo generar la cadena de Markov en C#
- 23. Cuál es la diferencia entre $ (...) y `...`
- 24. ¿Cuál es la diferencia entre dict() y {}?
- 25. ¿Cuál es la diferencia entre .ToString (+) y ""
- 26. ¿Cuál es la diferencia entre [indefinido] y [,]?
- 27. ¿Cuál es la diferencia entre VBScript's y el operador &?
- 28. ¿cuál es la diferencia entre las tareas AntCall y Ant?
- 29. ¿Cuál es la diferencia entre% s y% d en el formato de cadenas de Python?
- 30. Cuál es la diferencia entre las funciones VarIsEmpty y VarIsEmptyParam
Debería considerar aceptar la respuesta con la mayor cantidad de votos a continuación. – Ron