¿Conoce algún conjunto de datos de gran tamaño para experimentar con Hadoop que sea gratuito/de bajo costo? Se aprecian todos los indicadores/enlaces relacionados.Conjuntos de datos grandes y gratuitos para experimentar con Hadoop
prefernce:
Al menos uno GB de datos.
Datos de registro de producción del servidor web.
Pocos de ellos que he encontrado hasta ahora:
También podemos ejecutar nuestro propio rastreador para recopilar datos de sitios, p. Wikipedia? También se agradece cualquier sugerencia sobre cómo hacer esto.
datanami recientemente publicado esta lista de enlaces: http: //www.datanami. com/2015/01/29/9-places-get-big-data-now/- tal vez alguien tiene tiempo para convertir esto en una respuesta adecuada. – Nickolay