2010-12-28 19 views

Respuesta

6

solución simple: contar las apariciones de la palabra en el texto.

Hacer un buen trabajo es un problema difícil en el que empresas como Google han estado trabajando durante años. Si es posible, es posible que desee echar un vistazo a using their technology

Para ampliar, intente lo siguiente:

  • uso de un diccionario (por ejemplo WordNet para reemplazar todos los sinónimos de una palabra común
  • Detectar palabras similares usando Levenshtein distance

Eso sigue siendo sólo va a llegar tan lejos. Tendrá que realizar algún procesamiento del lenguaje natural para comprender verdaderamente lo que la descripción se trata de distinguir entre múltiples tex ts que contienen la palabra clave el mismo número de veces.

+0

¡Gracias! La distancia de Levenshtein fue lo que he estado tratando de recordar, sí :) En mi caso, no necesito ningún procesamiento hardcore. Solo quiero dar un puntaje de más de 100 para un texto de descripción realmente breve. – fgungor

Cuestiones relacionadas