2012-08-29 10 views
31

En los métodos de inteligencia artificial tenemos dos etapas de entrenamiento. Estas etapas son datos y pruebas.¿Cómo puedo hacer el paso Tren y prueba en Giza ++?

En la etapa de capacitación damos una gran cantidad de datos a un sistema y normalmente lo probamos con un volumen de datos menor. Luego evaluamos la salida.

Ahora la pregunta es: ¿esta formación se puede realizar a través de la funcionalidad incorporada incrustada en GIZA ++ o deberíamos escribir una aplicación separada para eso?

Si debemos escribir una solicitud por separado, ¿alguien puede ayudarme sugiriendo una solicitud ya escrita? O un manual? Nota: Quiero tener un programa de alineación no una traducción automática estadística

Preferiría entrenar en Giza ++ para que pueda probar con datos no observados.

Gracias de antemano.

+0

Entonces, ¿solo quieres encontrar un conjunto de datos para entrenar a tu modelo? ¿Por qué no usar los conjuntos de datos de alineación ya existentes? – Daniel

+3

Ver esto: http://stackoverflow.com/questions/5752043/is-there-a-tutorial-about-giza – Daniel

Respuesta

1

Este debería ser un buen punto de partida para entrenar un sistema mt de línea base usando Moses.
Normalmente GIZA ++ se usa para alinear palabras en el corpus paralelo.
Necesitará algunas otras herramientas como IRSTLM, SRILM o KenLM para la estimación del modelo de idioma.

Cuestiones relacionadas