2012-05-02 11 views
8

Estoy tratando de crear una colección de palabras en inglés que son difíciles de pronunciar.¿Hay alguna manera de clasificar la dificultad de la pronunciación de una palabra?

Me preguntaba si existe un algoritmo de algún tipo o una teoría, que se puede usar para mostrar cuán difícil es pronunciar una palabra.

¿Esto le parece algo que se puede calcular?

Como esto parece ser algo muy subjetivo, permítanme hacerlo más objetivo, digamos las palabras más difíciles de pronunciar por las tecnologías de texto a voz. programas

+1

¿Más difícil para quién? – dweiss

+2

Muchas palabras son difíciles de pronunciar para los programadores de Lisp. –

+0

Si bien este sería un problema muy interesante de resolver, el hecho de que el inglés contenga muchas palabras reconocibles a la vista ... tendría que haber muchas expectativas "codificadas" – afuzzyllama

Respuesta

3

Un enfoque sería crear una lista con dos versiones de cada palabra. Una es la ortografía correcta, y la otra es la palabra escrita con la ortografía fonética más simple. Aplique una función de distancia en las dos palabras (como la distancia de Levenshtein http://en.wikipedia.org/wiki/Levenshtein_distance). Cuanto mayor sea la distancia entre las dos palabras, más difícil será pronunciarla.

+0

¡Eso es muy inteligente amigo! – Yasser1984

0

Hasta cierto punto ...

del habla, por ejemplo, utilizan un sistema de fonética para tratar de pronunciar palabras.

Por ejemplo, "agarre" se dividiría en:

Gr-A-Sp

Sin embargo, para las palabras extranjeras (o palabras que no siguen este patrón), listas de excepciones tienen que ser guardado por ejemplo Yate

+0

Buen punto, ¿qué tipo de palabras tiene la mayoría de los programas de texto a voz tienen dificultad para pronunciar? – Yasser1984

1

¡Excelente problema! En la parte superior de mi cabeza puedes crear un sistema que contenga todas las letras del alfabeto fonético y con pesos conectados entre cada combinación en función de la dificultad (muy específico, puede necesitar pruebas múltiples y tomar promedios, etc.) y luego tener una lista de todos palabras del diccionario de inglés almacenadas en el disco y una secuencia de comandos que recorre cada entrada y realiza raspado web en wikipedia para la ortografía fonética y clasifica su dificultad. Esto podría tomar en consideración la longitud de la palabra así como la dificultad entre unir la fonética y luego ordenar la lista en función de la dificultad.

eso es lo que me tratar y hacer: P

0

sugerencia

Afortunadamente pronunciación como un proceso depende de unos dos factores que incluyen

  1. los móviles que componen el palabras y la ubicación de las vocales y semi vocales, es decir,

/a /,/ae /,/e /,/i /,/o /,/u /,/w /,/j/...

  1. longitud de la palabra .

la primera se refiere a la mecánica de producción de sonido de teléfono que el velo del paladar, mejillas lengua tener que alterarse para producir diversos sonidos relacionados con los teléfonos individuales es decir nasal etc. esto hace que algunas palabras más difíciles de pronunciar como el movimiento requerido puede ser mucho Consulte libros sobre fonética para encontrar posiciones de pronunciación de cada teléfono.

Algoritmo

a weighted spanning tree with weight being the difficulty of pronouncing two consecutive phones i.e l and r or /sh/ and /s/ 

buena suerte.

Cuestiones relacionadas