Tengo dos tablas que necesito fusionar en PostgreSQL, en la variable común "nombre de la empresa". Desafortunadamente, muchos de los nombres de las empresas no coinciden exactamente (es decir, MICROSOFT en una tabla, MICROSFT en la otra). Intenté eliminar palabras comunes de ambas columnas, como "corporación" o "inc" o "ltd", para intentar estandarizar los nombres en ambas tablas, pero me cuesta pensar en estrategias adicionales. ¿Algunas ideas?Corrientes difusas coincidentes
Gracias.
Además, si es necesario puedo hacer esto en R.
Considere también pg_trgm, he tenido mucho éxito en escenarios de deduplicación. – maniek