Somos estudiantes tratando de manejar el tamaño de datos de aproximadamente 140 millones de registros y tratando de ejecutar algunos algoritmos de aprendizaje automático. somos novatos de todas las soluciones en la nube y las implementaciones de mahout. Actualmente las hemos configurado en la base de datos postgresql, pero la implementación actual no se amplía y las operaciones de lectura/escritura parecen ser extremadamente lentas después de numerosos ajustes de rendimiento. Por lo tanto, estamos planeando ir a los servicios basados en la nube.Amazon EC2 vs PiCloud
Hemos explorado algunas alternativas posibles. servicios
- Amazon Cloud basado Mahout (aplicación)
- Picloud con scikits aprender (que tenían previsto utilizar el formato HDF5 con NumPy)
- favor recomiendan otras alternativas si las hay.
Aquí están las siguientes preguntas
- Lo que nos daría mejores resultados (tiempo de vuelta) y serían rentables? Por favor, mencione cualquier otra alternativa presente.
- En caso de que configuremos Amazon Services ¿cómo debemos tener el formato de datos? Si usamos dynamodb, ¿se disparará el costo?
Gracias
¿Podría comentar las posibilidades de PiCloud (Hdf5 con Scikit) VS AWS? –
no, no estoy familiarizado con PiCloud. – ObscureRobot