Estoy trabajando en un proyecto que requiere que haga coincidir una frase o palabra clave con un conjunto de palabras clave similares. Necesito realizar un análisis semántico para el mismo.Qué herramientas NLP usar para unir frases que tengan un significado o semántica similar
un ejemplo:
Relevante QT
seguro de salud barato
seguro de salud asequible
bajo costo del seguro médico del Plan
la salud por menos
de salud de bajo costo cobertura
significado común
seguro de salud a bajo costo
Aquí la palabra bajo la columna de Significado común debe coincidir con la columna de QT relevante. Miré un montón de herramientas y técnicas para hacer lo mismo. S-Match parecía muy prometedor, pero tengo que trabajar en Python, no en Java. También el análisis semántico latente se ve bien, pero creo que es más para la clasificación de documentos basada en una palabra clave en lugar de la coincidencia de palabras clave. Estoy algo familiarizado con NLTK. ¿Podría alguien dar alguna idea sobre qué dirección debo seguir y qué herramientas debería usar para hacer lo mismo?
¿Cuál es el alcance de su proyecto? Si está tratando con algunas palabras clave o sentidos centrales, puede ser fácil especificar manualmente las clases de equivalencia de palabras (por ejemplo, una lista de palabras de frases que significa "seguro de salud de bajo costo"). – dmh
Tengo que extraer palabras semánticamente similares, como seguro de salud de bajo costo de un grupo de alrededor de 200000 palabras. Estoy pensando que debo aplicar el agrupamiento después de ejecutar un algoritmo inicial en estas palabras para generar una especie de centros (palabras) que coincidirán semánticamente con palabras similares en su grupo. Todo el procedimiento no está supervisado. –