2010-11-15 9 views
35

Me preguntaba si alguien sabía dónde podía obtener diccionarios de palabras positivas y negativas. Estoy investigando el análisis de sentimientos y esta es una parte crucial de esto.Sentiment Analysis Dictionaries

Respuesta

32

El Sentiment Lexicon, en la Universidad de Pittsburgh podría ser lo que buscas. Es un léxico de aproximadamente 8,000 palabras con sentimiento positivo/neutral/negativo. Se describe con más detalle en this paper y se publica bajo la GPL.

6

This paper from 2002 describe un algoritmo para derivar dicho diccionario a partir de muestras de texto de forma automática, utilizando solo dos palabras como conjunto inicial.

+3

El problema es que este enfoque utiliza AltaVista golpea para calcular PMI-IR, así que no creo que es óptimo para alguien que quiere empezar. Además, es un enfoque no supervisado, y sus resultados aún no son interesantes si se los compara con los enfoques supervisados. –

19

Llegando un poco tarde solo señalaré que los diccionarios tienen una contribución limitada para el análisis de sentimiento. Algunas oraciones que contienen sentimientos no contienen ninguna palabra de "sentimiento", p. Ej. "leer el libro", que podría ser positivo en una reseña del libro, mientras que negativo en una reseña de la película. Del mismo modo, la palabra de sentimiento "impredecible" podría ser positiva en el contexto de un thriller pero negativa al describir el sistema de interrupciones del Toyota.

y hay muchos más ...

+0

Puntos realmente buenos. Afortunadamente para mí, estoy lidiando solo con ciertas fuentes de noticias que se abstendrían de utilizar la jerga y en general solo afirman hechos. Sin embargo, definitivamente es algo de lo que preocuparse, gracias. – user387049

+2

Creo que al usar diccionarios sin contexto, la esperanza es que, si bien puede haber una cierta cantidad de ruido (clasificación errónea) para oraciones individuales, habrá suficiente señal en conjunto para ser significativa. Sin embargo, no estoy seguro de cómo se podría probar esta esperanza con rigor estadístico. – mcduffee

2

AFINN se pueden encontrar aquí y también crearlo dinamicamente. Al igual que cada vez que se agrega una palabra desconocida + ve, añádelo con +1. Al igual que el banano es una nueva palabra + ve y aparece dos veces, se convertirá en +2.

¡Cuantos más artículos y datos tenga su diccionario se volverá más fuerte!

+3

Ese archivo es realmente un archivo de juguete, creado para una asignación de clase. En mi opinión, sería un error usarlo para el trabajo real. – mcduffee

+0

@mcduffee ¿Elaborar? – jbird

+0

@jbird No estoy seguro de qué puedo agregar. El archivo se creó para una asignación de clase, donde el texto para evaluar se adaptó a las palabras de la lista. Le faltan muchas, muchas palabras (la lista completa tiene menos de 2500 palabras). Intentar utilizarlo con texto que no se ha adaptado a las palabras de la lista, me temo, resultaría en evaluaciones del sentimiento menos precisas que las que proporcionaría una lista más completa. – mcduffee

16
0

Puede utilizar Vader sentimiento léxico

from nltk.sentiment.vader import SentimentIntensityAnalyzer 

sentence='APPle is good for health' 
sid = SentimentIntensityAnalyzer() 
ss = sid.polarity_scores(sentence) 
print(ss) 

se le dará la polaridad de la pena.

de salida:

{'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0} 
Cuestiones relacionadas