2008-09-11 12 views
67

¿Alguien sabe de alguna base de datos de muestra que pueda descargar, preferiblemente en CSV o en algún formato similar fácil de importar para que pueda obtener más práctica en el trabajo con diferentes tipos de conjuntos de datos?¿Dónde puedo encontrar bases de datos de muestra con datos formateados comunes que puedo usar en múltiples motores de bases de datos?

Sé que el Departamento de Medio Ambiente de Canadá tiene historical weather data que puede descargar. Sin embargo, no está en un formato común que pueda importar a cualquier otra base de datos. Además, solo puede ejecutar consultas basadas en el programa incluido, que en realidad es bastante limitado en cuanto a qué tipo de datos puede proporcionar.

¿Alguien sabe de algún conjunto de datos interesantes que están disponibles gratuitamente en un formato común que podría usar con mySql, Sql Server y otros tipos de motores de bases de datos?

+0

Por favor, vote a reabrir esta pregunta !!! convertcsv.com/generate-test-data.htm#keywords –

Respuesta

31

El blog datawrangling publicado una lista agradable hace un tiempo:

http://www.datawrangling.com/some-datasets-available-on-the-web

Incluye financiera, los datos del gobierno (trabajo, vivienda, etc.), y muchos más a la lista aquí.

+5

El enlace está muerto. Aquí hay una URL para una versión archivada: http://web.archive.org/web/20151106164622/http://www.datawrangling.org/some-datasets-available-on-the-web – Alhadis

3

¿En qué motor de base de datos está importando? Eso ayudará a determinar qué formatos puede incluir en su búsqueda.

La Comisión Federal Energy Regulatory tiene algunos datos de muestra para descargar en formato CSV.

2

es probable que pueda encontrar la base de datos Neptuno de SQL Server

Podría ser una exageración, pero se puede install OracleXE, creo que viene con algunos esquemas de ejemplo o se puede encontrar el esquema antiguo de Scott en línea.

Además, en serie Summer of NHibernate screencast de Stephen Bohlen se crea una base de datos de ejemplo, el código viene con él en archivos XML y se puede importar como se describe en el screencast (tal vez el episodio 2 o 3) y simplemente no eliminar eso mas tarde.

4

UnData y Swivel son buenas fuentes de datos. Cualquier base de datos debería poder importar archivos CSV.

14

Muchos de los datos en Stack Overflow están autorizados bajo create commons. Cada 3 meses lanzan un data dump con todas las preguntas, respuestas, comentarios y votos.

2

Para Firebird tienes empleado.FDB

en el sistema operativo Windows, que se encuentra allí C: \ Archivos de programa \ Firebird \ Firebird_2_1 \ ejemplos \ empbuild

3

el periódico The Guardian en el Reino Unido tiene un almacén de datos, http://www.guardian.co.uk/data-store, lleno de conjuntos de datos categorizados. En última instancia, todos se almacenan como Documentos de Google, por lo que puede exportarlos a csv & Excel.

3

Hay un montón de bases de datos gratuitas de ejemplo de SQL Server en CodePlex: http://www.codeplex.com/Wikipage?ProjectName=SqlServerSamples#databases

Una forma muy simple para obtener los datos de la muestra es utilizar aplicaciones completas. Necesitaba algunos datos de muestra para practicar lo que estaba aprendiendo con MySQL en ese momento y simplemente descargué PHPBB y usé su base de datos proporcionada. Si necesita agregar usuarios, etc., simplemente use el programa para hacerlo.

Piensa genérico. Puede obtener datos meteorológicos de fuentes comunes de forma gratuita, thetvdb.com tiene un conjunto de datos bastante ingeniosos para episodios de programas de televisión de forma gratuita, sitios como last.fm tienen una tonelada de datos disponibles para los hábitos de escucha de música. Si solo desea datos de muestra, la manera más fácil de obtenerlo no es pensar en términos de "Quiero una base de datos". Piense "qué información disponible de forma gratuita existe".

5

utilizo generatedata.com para generar esquemas de bases de datos personalizadas con entradas.

Para usarlo, simplemente puede registrar una nueva cuenta, o descargar sus fuentes e instalarlo en su servidor.

Puede exportar código generado en SQL, XML, JSON, o incluso lenguaje de script del lado del servidor como PHP, etc.

Cuestiones relacionadas