Ejemplo, tengo miles de millones de frases cortas, y quiero clústeres de ellas que sean similares.cómo encontrar oraciones/frases similares en R?
> strings.to.cluster <- c("Best Toyota dealer in bay area. Drive out with a new car today",
"Largest Selection of Furniture. Stock updated everyday" ,
" Unique selection of Handcrafted Jewelry",
"Free Shipping for orders above $60. Offer Expires soon",
"XXXX is where smart men buy anniversary gifts",
"2012 Camrys on Sale. 0% APR for select customers",
"Closing Sale on office desks. All Items must go"
)
Supongamos que este vector tiene cientos de miles de filas. ¿Hay un paquete en R para agrupar estas frases por su significado? o alguien podría sugerir una manera de clasificar las frases "similares" por el significado de una frase determinada.
¿Cómo se propone definir el "significado"? ¿Cuáles de tus frases de ejemplo deben agruparse? – tripleee