2012-05-25 37 views

Respuesta

20

Para explicar por ejemplo, usaré un ejemplo del procesamiento de lenguaje natural. Imagine que quiere conocer la probabilidad de esta frase:

que disfrutar de un café

En un modelo de Markov, se puede estimar su probabilidad mediante el cálculo:

P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy) 

Ahora, imagina que queríamos conocer las etiquetas de partes de discurso de esta oración, es decir, si una palabra es un verbo en tiempo pasado, un sustantivo, etc.

No lo hicimos observe cualquier parte-de-sp etiquetas eech en esa oración, pero nosotros asumimos que están allí. Por lo tanto, calculamos cuál es la probabilidad de la secuencia de etiqueta de partes de discurso. En nuestro caso, la secuencia real es:

PRP-VBP-NN

Pero espera! Esta es una secuencia a la que podemos aplicarle un modelo de Markov. Pero lo llamamos oculto, ya que la secuencia de partes de discurso nunca se observa directamente. Por supuesto, en la práctica, calcularemos muchas de esas secuencias y nos gustaría encontrar la secuencia oculta que mejor explica nuestra observación (por ejemplo, es más probable que veamos palabras como 'the', 'this', generadas a partir del determinador (DET etiqueta))

La mejor explicación que he encontrado es en un documento de 1989 por Lawrence R. Rabiner: http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf

3

Un modelo oculto de Markov es un proceso estocástico doble incrustado con dos niveles.

El nivel superior es un proceso de Markov y los estados son inobservables.

De hecho, la observación es una función probabilística del nivel superior que afirma Markov.

Los diferentes estados de Markov tendrán diferentes funciones probabilísticas de observación.

+10

La diversidad de esta respuesta debe estar entre comillas, haciendo referencia al tutorial de Rabiner. – Rhubarb

+0

Esto realmente no es fácil de entender en absoluto. – goelakash

+0

No es una respuesta clara. en absoluto. – Ron

19

Modelo de Markov es una máquina de estado con los cambios de estado son probabilidades. En un modelo oculto de Markov, no conoces las probabilidades, pero conoces los resultados.

Por ejemplo, cuando lanza una moneda, puede obtener las probabilidades, pero, si no puede ver los volteos y alguien mueve uno de los cinco dedos con cada lanzamiento de moneda, puede tomar los movimientos de los dedos y usar una modelo oculto de Markov para obtener la mejor estimación de los lanzamientos de monedas.

3

desde Matt utiliza etiquetas partes-de-voz como un ejemplo HMM, podría añadir una más ejemplo: reconocimiento de voz. Casi todos los sistemas de reconocimiento de voz continuo de gran vocabulario (LVCSR) se basan en HMM.

"ejemplo de Matt": que disfrutar de un café

En un modelo de Markov, se podía estimar su probabilidad mediante el cálculo:

P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy) 

En un modelo oculto de Markov,

Digamos que 30 personas diferentes leen la oración "I disfruta abrazando " y tenemos que reconocerlo. Cada persona pronunciará esta oración de manera diferente. Entonces NO sabemos si la persona quiso decir "abrazar" o "acaparar". Solo tendremos la distribución probabilística de la palabra real.

En resumen, un modelo de Markov oculto es un modelo estadístico de Markov en el que se supone que el sistema que se está modelando es un proceso de Markov con estados no ocultos (ocultos).

Cuestiones relacionadas