2011-12-24 9 views
8

Como parte de un proyecto de programación reciente, compilé una base de datos, cuyo contenido podría ser útil para otra persona algún día. Estoy buscando la mejor manera de 'abrir los datos'.¿Cuál es la mejor manera de abrir datos de origen (en lugar de código)?

Pude (y probablemente lo haré) cargar el SQL en GitHub, pero me preguntaba si alguien había encontrado una forma de compartir más 'centrada en los datos'; tal vez un sitio web que facilita a los usuarios navegar/consultar/visualizar/mejorar los conjuntos de datos, en lugar de simplemente darles un gran trozo de SQL.

Para aclarar, estoy buscando un lugar donde pueda compartir los datos, en lugar de un formato en el que compartirlo, idealmente un conjunto de datos equivalente a GitHub/Sourceforge.

Los datos son relativamente pequeños (unas pocas miles de líneas de SQL) por lo que el volumen no debería ser un obstáculo.

+1

¿Cuál es el tema de los datos? – Paul

+0

¿Y qué tan grande es el conjunto de datos? ¿Puede un usuario razonablemente descargarlo rápidamente? –

Respuesta

2

Soy un gran fan de Amazon's S3 para cosas como esta. Y si su conjunto de datos es lo suficientemente interesante, tal vez podría publicarlo con InfoChimps.

+0

Secundado: la infraestructura proporcionada por InfoChimps hace que esta sea una ruta mucho más fácil que la autodistribución. Si uno se autodistribuye, el S3 ofrece una buena opción de alojamiento. – Iterator

0

Puede exportarlo a XML, que probablemente sea el formato de datos más compatible, aunque es bastante prolijo. Otra solución es OData, pero esto implica alojar los datos y la plataforma que sirve los datos que pueden no ser deseables.

1

He trabajado con una gran cantidad de datos de diferentes compañías. La mayoría de las veces estos datos han estado en formato de datos delimitados por texto. El más popular, por supuesto, está separado por comas o tab. Usar comas es a menudo una buena opción porque MySQL también puede exportar e importar CSV. Aquí está un ejemplo:

id, first_name, last_name, address 
1, John, Smith, 11222 Stree Name 
1

Google Fusion Tables garrapatas algunas de estas cajas, aunque el énfasis parece estar en la visualización (no he usado, así que esto puede ser injusto). También soy reacio a comprometerme demasiado con cualquier producto de Google de segundo nivel en estos días, ya que tienen la costumbre de desaparecer.

0

Sparkfun es otra posibilidad, parece estar dirigida principalmente a fuentes de datos en tiempo real, pero ofrecen almacenamiento gratuito y la plataforma es de código abierto para que pueda alojar su propio servidor.

Cuestiones relacionadas