uso de JavaScript que necesito para eliminar eficazmente ~ 10000 palabras clave de un documento de Word ~ 100.000, de los cuales ~ 1000 habrá palabras clave. ¿Qué enfoque sugerirías?método eficiente para reemplazar varias palabras en el texto
¿Sería una masiva expresión regular ser práctico? ¿O debería simplemente recorrer los caracteres del documento buscando palabras clave (aburrido)?
Editar:
Buen punto: solo palabras completas, no partes. Y algunas palabras clave contienen espacios.
Estoy tratando de hacerlo todo del lado del cliente para reducir la presión en el back-end.
Pregunta interesante. Por un lado, una máquina de estado escrita a mano en un lenguaje compilado se vencería con la expresión regular, pero por otro lado, el Javascript es bastante lento, por lo que necesitaría probar y comparar si el motor de expresiones regulares es más rápido debido a que se compiló . –
¿Tiene que ser JavaScript o puede enviarlo al servidor para su transformación? Es difícil decir cuál será más eficiente sin algunos datos para probarlo. Si está usando Python, por ejemplo, puede segmentar los datos y enhebrar el proceso si realmente lo necesita. –
¿Está obligado a reemplazar solo palabras enteras o partes de la palabra también? Por ejemplo, palabra, palabra clave, palabra-raíz, todos tienen la palabra "palabra" en ellos, ¿cómo deben ser tratados? – meouw