De Google Analytics Tengo una lista (larga) de palabras clave que las personas utilizan en los motores de búsqueda para encontrar mi sitio web. Quiero encontrar las palabras clave 'básicos', hipotético ejemplo:¿Cómo agrupar las palabras clave del motor de búsqueda?
java online training
learning java
scala training
training for java
online training java
learn scala programming
El resultado ideal sería: 'java', 'la formación en línea', 'formación', 'Scala' y 'aprender'.
La dificultad parece estar detectar frases completas, haciendo caso omiso de las palabras comunes (por) y variaciones de manipulación (aprender-aprendizaje).
¿Hay una biblioteca que puede hacer eso (preferentemente para JVM)? ¿O hay un algoritmo adecuado que pueda implementar yo mismo?
Creo que se necesita para pasar más tiempo especificando sus necesidades. Incluso en su ejemplo limitado, no sé por qué no considera que la "programación" sea "esencial". –
¿Qué pasa si usa el número de resultados de Google para encontrar buenas palabras clave? Scala tendría menos resultados que para -> mejor palabra. Puede hacer una búsqueda de todas las frases posibles y registrar el número de resultados para cada frase, luego encuentre un rango donde existan buenas frases. (Eso fue solo una idea rápida, así que no lo estoy poniendo como una respuesta) –