Mi requisito es recibir artículos de noticias y determinar si son positivos o negativos sobre un tema. Estoy tomando el enfoque descrito a continuación, pero sigo leyendo NLP puede ser de utilidad aquí. Todo lo que he leído apunta a que la PNL detecta la opinión de los hechos, lo cual no creo que importe mucho en mi caso. Me pregunto dos cosas:Mejor enfoque algorítmico para análisis de opinión
1) ¿Por qué mi algoritmo no funcionaría y/o cómo puedo mejorarlo? (Sé que el sarcasmo probablemente sería un escollo, pero de nuevo no veo que eso ocurra mucho en el tipo de noticias que recibiremos)
2) ¿Cómo podría ayudar NLP, por qué debería usarlo?
Mi enfoque algorítmico (tengo los diccionarios de, y palabras de negación negativos positivos):
1) Contar el número de palabras positivas y negativas en el artículo
2) Si se encuentra una palabra de negación con 2 o 3 palabras de la palabra positiva o negativa, (es decir: NO el mejor) niegan el puntaje.
3) Multiplique las puntuaciones por los pesos que se han asignado manualmente a cada palabra. (1.0 para comenzar)
4) Sume los totales de positivo y negativo para obtener el puntaje de opinión.
El análisis del sentimiento es, por definición, una forma de PNL; estás procesando texto en lenguaje natural. La única forma de saber exactamente qué tan bien funcionará su enfoque es intentarlo. Convenientemente, eso también le dirá si funciona lo suficientemente bien para su propósito, que en realidad es la parte que importa. –
Consulte esta pregunta y sus respuestas para un algoritmo sencillo que funciona bien en la práctica: http://stackoverflow.com/questions/3920759/unentrenamiento-entrenamiento –
Mi algoritmo es el mejor algoritmo. Porque soy un estudiante de posgrado haciendo investigación en el análisis de sentimientos, y tengo un gran ego *:) * –