2008-11-14 10 views
9

Tengo un conjunto de nombres y direcciones que se han ingresado y sobresalen en la hoja de cálculo, pero el problema es que las muchas personas que ingresaron las direcciones los ingresaron en muchos formatos diferentes no estándar. Quiero borrar las direcciones antes de transferirlas a mi base de datos. Mirando a mi alrededor, todo lo que encontré en la forma de depuradores de direcciones (analizadores o formateadores) es el que se saca por Semaphore. Para mis propósitos, realmente no necesito todo eso y no quiero pagar las tarifas de licencia del software. ¿Hay algo por ahí que sea gratuito y/o de código abierto que me fregará?Scrubber de dirección de fuente abierta?

+0

Quizás proporcione algunos datos de ejemplo. – Till

Respuesta

6

Como trabajo en el negocio de correo ...

Una dirección mailable no está geocodificación. Uno le permite al USPS entregar el correo y el otro le dice dónde está ese punto. USPS no geo-codifica sus direcciones mailables. Es útil para marcar áreas/regiones de personas para la orientación.

No está comprando una licencia para el software, está comprando los datos. La oficina de correos tiene muchas reglas especialmente si estás haciendo esto comercialmente y tratando de obtener una tarifa mejor que la de primera clase. Consulte USPS Domestic Mail Manual para obtener la lista completa de reglas. El USPS mueve las cremalleras y los hogares entre las cremalleras todo el tiempo. La empresa (para la que trabajo) paga al USPS por su lista de correo actualizada para que podamos mantener nuestras bases de datos actualizadas. Semanal.

Volver a tu pregunta. ¿Desea cambiar los datos en un formato común (calle -> calle) o busca duplicados y desea almacenar solo direcciones reales disponibles?

para un formato común; puede dividir la dirección en partes, limpiar el espacio en blanco y aplicar un diccionario de términos/traducciones. Luego aplique algunos sql para encontrar los duplicados. Tenga en cuenta que los hogares (1 st principal) son diferentes de las personas (john doe, 1 st principal).

para las direcciones mailables, a algunos de ustedes (los lectores) no les gustará esta respuesta, pero quieren información y eso no es gratis. Alguien gasta tiempo o dinero para adquirir y mantener estas listas. Por lo tanto, busque un modelo comercial para adquirir fondos para la lista o vaya a alguien que lo haga por usted. Data and mail management

Realistically, Semaphore es bastante barato, solo tenga en cuenta que la dirección db tendrá que actualizarse trimestralmente y $ 19/quarter es bastante barato.

Otro producto de limpieza de direcciones. SAP PostalSoft. Sin embargo, no sé cuánto costará la información.

0

La mayoría del software con el que he trabajado para hacer esto es muy caro (o para decirlo de otra manera, los departamentos de marketing son ingenuos y tienen presupuestos enormes).

Este tipo de trabajo es un precursor de Geo-codificación. Este linked Wiki article incluye una lista del software Geocoding, algunos de los cuales son gratuitos. Si tiene suerte, algunos de los gratuitos pueden incluir rutinas de estandarización de direcciones.

Si encuentra una buena, hágamelo saber.

0

Usamos Accuzip. Es mucho más barato que la mayoría de las soluciones (~ $ 700/año) y viene con actualizaciones bimensuales. Utiliza la API de estandarización de direcciones de USPS, para la cual he escrito un contenedor .NET. Esto me permite ejecutarlo en tiempo real (Accuzip, por defecto, viene solo con un modo por lotes).

3

realidad yo trabajo en la industria de la verificación de la dirección ... La respuesta de Jim es aceptar una inteligente. Desafortunadamente para aquellos de nosotros con bajos presupuestos, los datos oficiales de USPS son caros y los sistemas son complicados. (Lo sé por experiencia, ya que la empresa para la que trabajo, SmartyStreets, proporciona verificación de direcciones a tasas más bajas que la mayoría.)

Lo mejor que puedo hacer aquí para ayudar es recomendar una alternativa de bajo costo/libre (dependiendo de su volumen) como LiveAddress, donde para una lista de direcciones no hay compras mínimas, y la API es súper barata y super fácil, comparativamente.

+0

ACTUALIZACIÓN: el servicio de API de validación de direcciones (en SmartyStreets) ahora es de uso gratuito, si aún necesita una buena solución. – Matt

Cuestiones relacionadas