Estoy interesado en escribir un guión PHP (sí doy la bienvenida a las sugerencias de agnóstico del lenguaje) que transliteraría una oración o palabra escrita en inglés (phoenetically) en el guión de otro idioma. Dado que estoy mirando el inglés escrito phoenixically (es decir, de oído): tendría que lidiar con la ortografía variante de la misma palabra.Transliteración inteligente en PHP
Se supone que no existe una norma para la romanización (por ejemplo, en chino, tiene la Simplificado Wade, etc.)
¿Alguien tiene algún consejo sobre donde podría empezar?
EDIT: estoy haciendo esto solo con fines educativos, y al principio tenía la impresión de que para averiguar la conexión entre la ortografía variante (que se podía encontrar en un corpus de mensajes de MI, publicaciones de Facebook escritas en la forma romanizada del idioma), necesitarías algún tipo de herramienta de aprendizaje automático. Sin embargo, me gustaría saber si estoy en el camino correcto, y me gustaría algo de ayuda para averiguar qué debo hacer para que funcione (por ejemplo, ¿qué herramienta de aprendizaje automático debo estudiar?) .
Sin entrar demasiado carnoso - variantes ortográficas de una palabra extranjera (normalmente escrito en su propio guión), tales como " eheree "versus" ehery ", o" ei "frente a" ey ". Entiendo que no es mucho: esperaba una solución que requiriera un poco de análisis estadístico sobre un corpus determinado (por ejemplo, mensajes de mensajería instantánea o actualizaciones de Facebook escritas en la forma romanizada del idioma). – arkate