Probé el clasificador de bayes naive y está funcionando muy mal. SVM funciona un poco mejor, pero sigue siendo horrible. La mayoría de los artículos que he leído sobre SVM y naive bayes con algunas variaciones (n-gram, POS, etc.) pero todos dan resultados cercanos al 50% (los autores de artículos hablan de un 80% y alto pero no puedo obtener la misma precisión en datos reales).Buen algoritmo para análisis de sentimiento
¿Hay alguna métodos más potentes excepto analys lexixal? SVM y Bayes suponen que las palabras independet. Este enfoque llamado "bolsa de palabras". ¿Qué pasa si suponemos que las palabras están asociadas?
Por ejemplo: Utilice apriory algoritmo para detectar que si contiene frases "malo y horrible", entonces el 70% probality que la sentencia es negativa. También podemos usar la distancia entre palabras, etc.
¿Es buena idea o estoy inventando bicicleta?
¿Qué opinas sobre algoritmo previo y assotiation entre palabras? – Neir0
@ Neir0: No veo de inmediato cómo te gustaría aplicarlo. Tampoco he visto intentos de hacer análisis de sentimientos con él. Sé que algunas personas lo usan para construir aproximaciones al kernel cuadrático (más o menos lo que ustedes llaman "asociaciones de palabras"), pero primero probaría un kernel vanilla SVM primero. –
La manera directa es ingresar tokens con badge neg o pos. Por ejemplo: "pos i love my mom". En la salida, recibo algo así como "si tenemos amor y mamá en las sentencias, entonces el 70% que tenemos la insignia de puesto". Por supuesto, podemos modificar este enfoque para obtener mejores resultados. – Neir0