2011-02-07 6 views
8

Dónde obtener conjuntos de datos para la generación de datos aleatorios o de prueba, como nombres/apellidos con distribución, datos de direcciones, nombres de universidades/escuelas, nombres de compañías, etc.?Conjuntos de datos para generación realista de datos aleatorios/de prueba

He encontrado la lista de nombres y apellidos en inglés, con el recuento de ellos (desafortunadamente no he notado de dónde lo obtuve). Obtuve la base de datos de direcciones de Polonia. Sin embargo, estos conjuntos de datos de otros países también me serían muy útiles. Entonces con nombres de universidades y escuelas.

¿Qué datos necesita como fuente de dicha información? ¿Podría proporcionar enlaces a tales datos? (por supuesto, solo aquellos que son gratuitos a disposición del público)

+0

Estoy marcando esta pregunta porque está fuera del tema de Desbordamiento de pila. Las preguntas que nos piden que recomiendemos o busquemos un libro, herramienta, biblioteca de software, tutorial u otro recurso externo están fuera del tema de Stack Overflow, ya que tienden a atraer respuestas obstinadas y spam. En cambio, describa el problema y lo que se ha hecho hasta ahora para resolverlo. – cybermonkey

Respuesta

4

Existen muchos generadores de datos de prueba de fuente abierta y comercial en Internet. Por debajo de 2 son buenos

  1. http://www.sqledit.com/dg/
  2. http://www.generatedata.com/#about
  3. de azar/números de cuerdas: http://www.random.org/
+0

El segundo enlace es bastante bueno, contiene algunos datos que necesito, pero me gustaría tener conjuntos de datos más amplios. Primero es comercial y el segundo es solo aleatorio completo. –

2

Amazon ha hecho varios conjuntos de datos públicos disponibles para su descarga gratuita: http://aws.amazon.com/publicdatasets/

+0

Lo estaba intentando, pero no pude encontrar el enlace de descarga en esa página –

2

Trate http://www.mockaroo.com

Puede generar hasta 100.000 filas de datos en CSV, formatos delimitados por tabuladores y SQL, guardar & esquemas de reutilización, y automatizar la generación de los datos de prueba usando rizo.

1

Hay una API gratuita en http://randomprofile.com/api-for-developers/ para generar perfiles de usuarios de prueba que incluyen nombre, apellido, dirección, información bancaria, número CC, tipo de sangre, etc. No estoy seguro acerca de las escuelas, pero es útil si está buscando datos en Usuarios asiáticos.

Cuestiones relacionadas