Me han entregado una tabla con aproximadamente 18000 filas. Cada registro describe la ubicación de un cliente. El problema es que cuando la persona creó la tabla, no agregaron un campo para "Nombre de la compañía", solo "Nombre de la ubicación", y una empresa puede tener muchas ubicaciones.Normalización de una tabla con baja integridad
Por ejemplo, aquí hay algunos registros que describen el mismo cliente:
Localización Tabla
ID Location_Name
1 TownShop#1
2 Town Shop - Loc 2
3 The Town Shop
4 TTS - Someplace
5 Town Shop,the 3
6 Toen Shop4
Mi objetivo es hacer que parezca:
Localización Tabla
ID Company_ID Location_Name
1 1 Town Shop#1
2 1 Town Shop - Loc 2
3 1 The Town Shop
4 1 TTS - Someplace
5 1 Town Shop,the 3
6 1 Toen Shop4
Company Tabla
Company_ID Company_Name
1 The Town Shop
No hay una mesa "Compañía", que tendrá que generar la lista Nombre de la empresa desde el más descriptivo o mejor Lugar Nombre que representa las múltiples ubicaciones.
Actualmente estoy pensando que necesito generar una lista de nombres de ubicación que sean similares, y luego revisar esa lista a mano.
Se agradece cualquier sugerencia sobre cómo puedo abordar esto.
@Neall, gracias por su declaración, pero desafortunadamente, cada nombre de ubicación es distinto, no hay nombres de ubicación duplicados, solo similares. Entonces, en los resultados de su extracto "reccount" es 1 en cada fila.
@yukondude, Su paso 4 es el corazón de mi pregunta.