2010-03-05 9 views
5

Comencé a trabajar en un proyecto que requiere el procesamiento de lenguaje natural. Realizamos el corrector ortográfico y mapeamos oraciones a frases y sus sinónimos. Primero pensé en usar GATE, pero estoy confundido sobre qué usar. Encontré una publicación interesante aquí que me confundió aún más.Paquete de procesamiento de lenguaje natural

http://lordpimpington.com/codespeaks/drupal-5.1/?q=node/5

Por favor, ayúdame a decidir sobre lo que conviene a mi propósito el mejor. Estoy trabajando en una aplicación web que nos servirá de herramienta NLP como servicio.

+1

No hay tal cosa, en cierto sentido, como 'PNL'. Sería mejor si fuera realmente específico en cuanto a las tareas que necesita realizar. – bmargulies

+0

Vea lo que básicamente necesito es cualquier arquitectura/herramienta básica que me ayudaría a trabajar en la configuración de sistemas de aprendizaje automático. Las oraciones que entran como entrada deben correlacionarse con ciertas frases/sinónimos de frases que pueden estar presentes en la oración. Qué sentimiento de la oración se correlaciona con cuál de las frases configuradas por mí. – Arc

+2

Parece un duplicado de http://stackoverflow.com/questions/2061881/natural-language-parsing-tools-what-is-out-there-and-what-is-not para mí. –

Respuesta

6

Usted realmente no da mucha información, pero intenta esto: http://www.nltk.org/

No creo NLTK hace la corrección ortográfica (puedo estar equivocado en esto), pero puedo hacer las partes del discurso de marcado para el texto entrada.

para encontrar/juego sinónimos usted podría utilizar algo como WordNet http://wordnet.princeton.edu/

Si estás haciendo algo realmente dominio específico: Recomiendo venir para arriba con su propia ontología términos específicos de dominio.

+0

Existen múltiples dominios para los cuales se debe realizar el análisis. ¿Qué sugieres en tal caso? Para una configuración básica, ¿qué puedo usar? Algo así como una PUERTA ... ¿Cuán útil puede ser? – Arc

+0

Depende de qué tan de cerca coincidan con una determinada ontología (como WordNet). Si está usando la mayoría de los términos de la misma manera que una ontología predefinida, entonces no necesita hacer la suya propia. Si usa los mismos términos de diferentes maneras, entonces puede necesitar crear uno nuevo. Si tiene varios dominios que usan términos de diferentes maneras, puede que necesite crear más de uno. – adam

3

Si está utilizando Python puede desarrollar un corrector ortográfico con Python Enchant. NLTK es bueno también para desarrollar el sistema de Análisis de Sentimientos. Tengo algunos prototipos del mismo también

Jaggu

Cuestiones relacionadas