en R, tengo una columna en una hoja.de.datos así:Cómo buscar múltiples cadenas y reemplazarlos con nada dentro de una lista de cadenas
npt2 nombre $
[1] "Andreas Groll, MD"
[2] ""
[3] "Pan-Chyr Yang, PHD"
[4] "Suh-colmillo Jeng, Sc.D"
[5] "Mostafa K Mohamed Fontanet Arnaud"
[ 6] "Thomas Jozefiak, MD"
[7] "Monitor Médico"
[8] "Qi Zhu, MD"
[9] "acebo Posner"
[10] "Peter S Sebel, MB BS, PhD Chantal Kerssens, PhD"
[11] "Lance A Mynderse, MD"
[12] "Lawrence Currie, MD"
Probé gsub pero sin suerte. después de hacer toupper (x) Necesito reemplazar todas las instancias de 'MD' o 'M.D.' o 'PHD' sin nada ''.
¿Hay un pequeño truco dentro de R para hacerlo?
De hecho estaría interesado en ver que se haga en una sola cuerda y lo diferente es que se haga en un comando en la lista entera (no soy muy bueno en la programación funcional aún)
¿Qué hay sobre "Sc.D"? –
Esperaba evitar expresiones regulares ya que simplemente puedo enumerar todas las cadenas malas que se eliminarán. Oh mi ... otra tecnología más (REgEx) para volver a (remasterización) :-( – userJT
El campo debe ser solo apellido, pero los datos no son consistentes. El objetivo es terminar con solo datos que son ya sea un apellido o nombre y eliminar todos los títulos académicos o de otro tipo – userJT