Tengo un archivo que contiene muchas vocales con signos diacríticos. Necesito hacer estos reemplazos:¿Cómo eliminar todos los signos diacríticos de un archivo?
- Reemplace ā, á, ǎ, y à con a.
- Reemplace ē, é, ě, y è con e.
- Reemplace ī, í, ǐ, y ì con i.
- Reemplazar ō, ó, ǒ, y ò con o.
- Reemplace ū, ú, ǔ, y ù con ud.
- Reemplace ǖ, ǘ, ǚ, y ǜ con ü.
- Reemplazar A, a, ǎ, y una con A.
- Reemplazar E, E, E, y E con E.
- Reemplazar I, i, ǐ, y con I.
- reemplace la junta , Ó, Ǒ, y Ò con O.
- Reemplazar Ū, Ú, Ǔ y U con U.
- Reemplazar Ǖ, Ǘ, Ǜ y Ǜ con Ü.
Sé que puedo sustituirlos por uno a la vez con esto:
sed -i 's/ā/a/g' ./file.txt
¿Hay una manera más eficiente para reemplazar la totalidad de estos?
sed posiblemente no sea la mejor herramienta para este trabajo; iconv es probablemente mejor. ver: http://stackoverflow.com/questions/8562354/remove-unicode-characters-from-textfiles-sed-other-bash-shell-methods – geoffspear