Puramente académico, pero me está frustrando.Eliminar palabras duplicadas en una línea con sed
Quiero corregir este texto:
there there are are multiple lexical errors in this line line
usando sed. Llegué hasta aquí:
sed 's/\([a-z][a-z]*[ ,\n][ ,\n]*\)\1/\1/g' < file.text
¡Corrige todo excepto las palabras finales dobladas!
there are multiple lexical errors in this line line
¿Puede un gurú de sed explicar por qué lo anterior no se ocupa de las palabras al final?
N. B. RE - '[, \ n]' sed usa '\ n' como un delimitador de línea. Entonces, a menos que insertes '\ n' en el espacio de patrones, nunca los encontrarás después de haber leído una línea en el espacio del patrón. – potong