2012-07-17 44 views
5

Alguien ha usado ambos para proporcionar una buena comparación. Estoy haciendo un proyecto escolar, por lo que el costo de SSIS no es un problema ya que ya tenemos la licencia para ello.SSIS vs Pentaho

Antecedentes de qué está pasando. Voy a descargar unos 10 años de información de patentes en archivos planos. El resultado será 2,080 archivos delimitados. Quiero una forma de cargarlos en el servidor MS SQL todo a la vez. Entonces, quiero poder agregar archivos adicionales en el DB a medida que se publican.

La velocidad del software no me molesta mucho ya que puedo dejarla funcionar durante la noche. Solo busco algo con cierta flexibilidad y, lo que es más importante, bastante fácil de usar. Nunca antes había hecho un proyecto como este y aprenderé cómo hacerlo desde las tablas.

GRACIAS!

+1

Nunca funcionó con Pentaho, pero desde SSIS prueba esto: http://msdn.microsoft.com/en-us/library/dd537533(v=sql.100).aspx –

+0

WOW 1tb en 30 minutos es lo suficientemente rápido para mí . Gracias por el artículo @WilliamToddSalzman ... –

Respuesta

5

He utilizado tanto en proyectos reales. Prefiero Pentaho (PDI) sobre SSIS debido a su facilidad de uso y flexibilidad. Lea un poco sobre el tema antes de comenzar a usarlo. Hay un par de libros excelentes sobre hervidor (PDI), o puede leer el menú de Inicio de Ayuda de PDI. El foro es un buen lugar si estás atrapado o ## pentaho en el IRC. Lo que también ayuda mucho son los ejemplos que puede encontrar en la pantalla de bienvenida. Espero que lo disfrutes, sé que todavía lo disfruto. Han estado utilizando desde 2006 y siempre estoy molesto cuando tengo que usar SSIS en algún proyecto :-)

PS: utilizar un jtds JDBC-controlador para conectarse a una base de datos SQL Server, que le ahorrará algunos dolores de cabeza

Espero que esto ayude,

Bart

+0

Gracias por las respuestas. En los conjuntos de datos de muestra que he estado trabajando con los archivos planos, ha sido problemático por decir lo menos. Puedo importarlos a Excel o Access bien, pero en el segundo intento usar MS SQL Server. Básicamente me dicen que estoy drogado. Entonces, lo que tengo que hacer es importar datos para acceder, luego guardar como .mdb, luego importar desde el acceso a SQL Server. ¿Ayudaría la mayor flexibilidad en pentaho con este problema? –

+0

Solo estoy preguntando porque el programa de descarga de datos ya está codificado y funciona en cierta medida, obviamente la forma en que el problema es delimitar los datos, pero si pudiera encontrar algo que me permita corregirlo después de que los datos se vuelquen en lugar de teniendo que aprender a codificar Python estaría muy emocionado. –

1

Después de pasar un par de días el desarrollo de un paquete ETL de SSIS PDI y me siento seguro al decir que la PDI es definitivamente más fácil de usar. La interfaz de usuario por sí sola es mucho más limpia y parece fluir de una manera muy intuitiva y, por lo tanto, fácil de usar.