2010-09-23 22 views
13

Estoy buscando una solución impulsada por Java a un requisito para analizar oraciones para registrar si una palabra clave se utilizó positiva o negativamente.Bibliotecas de análisis de texto Java

es decir, la palabra clave podría ser 'coles' y la frase: -

'me gusta coles, pero no los guisantes'

Y me gustaría un analizador de texto java de algún tipo para iniciar la sesión como esta positivo. ¿Se pueden utilizar las bibliotecas lucene (Hibernate-Search) para esto?

¿Alguna idea?

Respuesta

16

Usted está buscando "análisis de sentimiento". Una posibilidad es LingPipe, quien gentilmente link to their competitors also. Jeff Dalton también tiene una gran lista de herramientas de procesamiento de lenguaje natural en his blog.

+1

Hay muchas cosas aquí. Llevará algún tiempo analizarlo. Informaré sobre mis hallazgos, pero muchas gracias por los consejos. – jaseFace

+0

Sí, informe si encuentra algo útil. – ishnid

0

Eche un vistazo a Mahout Taste, que se basa en Lucene pero agrega mucho de lo que necesita fuera de la caja. (Editar) Debo añadir, Mahout Taste es simplemente relacionado a lo que estás buscando y no una coincidencia del 100%.

+3

(Yo soy el autor). Taste es un motor de filtrado colaborativo. El proyecto de encapsulado, Mahout, se refiere a la minería de datos más general, pero no incluye el análisis de los sentimientos. –

1

Dudo que haya algo así. Lucene definitivamente no puede hacerlo de la caja.

¿Cómo se define definir "si una palabra clave se utilizó positiva o negativamente" de una manera que se puede evaluar mediante programación? Para hacerlo correctamente, tendría que analizar el texto por su significado real, que es un problema de IA que ni remotamente se resuelve.

Supongo que podría resolverlo aproximadamente haciendo un análisis estadístico de si la palabra clave aparece con mayor frecuencia cerca de palabras clave positivas (como, bueno, excelente, maravilloso) o negativas (malas, de odio, de mierda, malditas), pero incluso allí, las negaciones, el sarcasmo y las estructuras de oraciones complejas serán problemáticas.

+0

Me recuerda a un traductor que comenzó con "el espíritu está dispuesto, pero la carne es débil", y regresó con "el vino es bueno, pero la carne está podrida". –

Cuestiones relacionadas