Estoy trabajando en un proyecto que incluye la limpieza de una lista de datos sobre carreras universitarias. Encuentro que muchos están mal escritos, así que estaba buscando usar la función gsub()
para reemplazar los errores ortográficos con su ortografía correcta. Por ejemplo, diga 'biolgy' está mal escrito en una lista de mayores llamada Major. ¿Cómo puedo hacer que R detecte el error de ortografía y lo reemplace con su ortografía correcta? Intenté gsub('biol', 'Biology', Major)
pero eso solo reemplaza las primeras cuatro letras en 'biolgy'. Si lo hago gsub('biolgy', 'Biology', Major)
, funciona solo para ese caso, pero eso no detecta otras formas de errores ortográficos de "biología".En R, ¿cómo reemplazo una cadena que contiene un cierto patrón con otra cadena?
¡Gracias!
Gracias por su respuesta, jugué con agrep justo ahora. Me parece que simplemente devuelve un número entero (que supongo que corresponde a la cantidad de cadenas modificadas), pero ¿realmente ejecuta el cambio? Entonces, por ejemplo, di que tenía animals = c ("mouse", "dog", "cat"). Si quisiera reemplazar el mouse con, digamos "cheese", ¿puedo usar agrep ("mou", "cheese", animals)? Devuelve un número entero (0) cuando hago esto. ¡¡Gracias!! – Alan
'agrep' devuelve índices de vectores, por lo que puede asignar fácilmente un valor mediante el uso de subíndices:' animals [agrep ("mou", animals)] <- "cheese" ' – aL3xa
Excelente gracias :) – Alan