Estoy tratando de analizar las palabras de una cadena y ponerlos en una matriz. He intentado lo siguiente:Ruby: Extraer palabras de Cadena
@string1 = "oriented design, decomposition, encapsulation, and testing. Uses "
puts @string1.scan(/\s([^\,\.\s]*)/)
Parece que hacer el truco, pero es un poco inestable (que debería incluir más caracteres especiales, por ejemplo). ¿Hay una mejor manera de hacerlo en ruby?
Opcional: Tengo una descripción del curso cs. Tengo la intención de extraer todas las palabras y colocarlas en una matriz de cadenas, eliminar la palabra más común en el idioma inglés de la matriz producida, y luego usar el resto de las palabras como etiquetas que los usuarios pueden usar para buscar cs cursos.
El idioma inglés es difícil de analizar con expresiones regulares. ¿Has considerado un analizador de lenguaje natural? Reconocerá más exactamente la diferencia entre los períodos en la oración 'Sr. Smith está aquí. Y devuelve 'Sr.' como una sola palabra que incluye el punto, pero' aquí' sin el punto. –
@MarkByers, muy buen punto, no lo hice en este punto. Lo investigaré. ¡Gracias! – sybohy