35

Mi empresa está fuertemente invertida en MS BI Stack (SQL Server Reporting Services, -Analysis Services y -Integration Services), pero quiero echarle un vistazo a lo que aparentemente se ha hablado más sobre open-source alternativa es Pentaho.Pentaho vs Microsoft BI Stack

He instalado una versión y la ejecuté sin problemas. Así que eso es bueno. Pero realmente no tengo el tiempo para comenzar a usarlo para el trabajo real para obtener una comprensión completa del paquete.

¿Alguno de ustedes tiene alguna idea de cuáles son los pros y contras de Pentaho vs MS BI, o cualquier enlace a tales comparaciones?

¡Muy apreciado!

Respuesta

50

Revisé varias pilas Bi mientras estaba en una ruta para salir de Business Objects. Muchos de mis comentarios son preferidos. Ambos juegos de herramientas son excelentes. Algunas cosas son como prefiero el helado de brownie de chocolate con chocolate puro.

Pentaho tiene algunos tipos muy inteligentes que trabajan con ellos, pero Microsoft ha estado en una ruta bien financiada y bien planificada. Tenga en cuenta que los MS siguen siendo los menos favorecidos en el mercado de bases de datos. Oracle es el rey aquí. Para ser competitivo, MS ha estado regalando muchos artículos cuando compra la base de datos y se han visto obligados a reinventar su plataforma un par de veces. Sé que esto no se trata de la base de datos, pero la batalla de DB ha causado que MS regale mucho para agregar valor a su pila.

1.) Plataforma
SQL Server no se ejecuta en Unix o Linux por lo que se excluyen automáticamente de este mercado. Windows es casi el mismo precio que algunas versiones o Unix ahora. Windows es bastante barato y funciona ahora bastante bien. Me da tantos problemas como Linux.

2.) OLAP
Los servicios de análisis se reinventaron en 2005 (actual es 2008) con respecto a la versión de 2000. Es una orden de magnatud más poderosa que 2000. El pentaho (Mondrian) no es tan rápido una vez que te haces grande. También tiene algunas características. Es bastante bueno, pero hay menos herramientas. Ambos soportan Excel como la plataforma que es esencial. La versión MS es más robusta.

3.) ETL
MS - DTS ha sido reemplazado con SSIS. De nuevo, el orden de aumento de la velocidad, potencia y habilidad. Controla cualquier movimiento de datos o control de programa. Si no puede hacerlo, puede escribir un script en Powershell. A la par con Informatica en el lanzamiento de 2008. Pentaho - Mucho mejor de lo que solía ser. No tan rápido como me gustaría, pero puedo hacer casi todo lo que quiero hacer.

4.) tablero
Pentaho ha mejorado esto. Es algo incómodo y antipático desarrollarlo, pero realmente no hay un equivalente real para MS.

5.) informa
MS reports es realmente potente pero no es tan difícil de usar. Ahora me gusta, pero lo odié al principio, hasta que lo conocí un poco mejor. He estado usando informes de cristal y el generador de informes MS es mucho más poderoso. Es fácil hacer cosas difíciles en MS, pero es un poco más difícil hacer cosas fáciles. Pentaho es un poco torpe. No me gustó para nada pero podrías. Me pareció demasiado complejo. Ojalá fuera más parecido al generador de informes de Crystal o al generador de informes de MS, pero es similar a jaspe. Encuentro que es ser duro. Eso puede ser una preferencia.

6.) ad hoc
MS: este fue el verdadero ganador para mí. Lo probé con mis usuarios y se enamoraron al instante del creador de informes de usuarios de MS. Lo que marcó la diferencia fue que no solo era fácil de usar, sino también productivo. Pentaho - es bueno pero bonito en la vieja escuela. Utiliza el modelo más típico basado en asistente y tiene herramientas potentes, pero lo odio. Es una excelente herramienta para lo que es, pero hemos pasado de este estilo y nadie quiere regresar. Mismo problema que tuve con logiXML. La interfaz funcionó bien para lo que era, pero en realidad no es un gran cambio de lo que usamos hace 12 años. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Hay personas con experiencia que pueden hacer que Pentaho funcione realmente bien, solo encontré que el MS Suite es más productivo.

+0

Excelente y bien escrito, gracias! – Tomas

+0

Stradas, está brindando gran información a toda la comunidad. Bien escrito, sus advertencias sobre las cosas que podrían ser inexactas debido a sus propias preferencias y la organización del contenido proporcionan un gran punto de referencia. Gracias por tomarse el tiempo para esto. – vmarquez

+0

NagaMensh, ¿puedes ser más específico? La curva de aprendizaje es un poco larga en comparación con DTS, pero considero que SSIS es una herramienta bien pensada. Informatica es la comparación más cercana. Hay otras buenas herramientas que también son fáciles de usar, pero la mayoría de ellas no son tan robustas. – Stradas

3

No puedo ofrecer ninguna entrada en MS Stack MS pero en la más reciente Barcamp Orlando, la gente de Pentaho estaba allí y habló sobre sus productos y fue una demostración extremadamente impresionante.

El hecho de que sea un proyecto de código abierto que puede extender usted mismo, así como un paquete pagado por un servicio realmente bueno le deja con un montón de opciones. Demostraron un trabajo remunerado que hicieron por un cliente y definitivamente cautivaron a la multitud.

También tuve la oportunidad de conversar un poco con un desarrollador que trabajaba en el lado del almacenamiento de datos para Pentaho y era extremadamente astuto, estaba abierto a sugerencias y no tenía problemas para responder cualquier pregunta.

Por lo que respecta a una empresa, Pentaho realmente me impresionó con su trabajo y lo amigable y accesible que eran todos sus desarrolladores.

0

Si está buscando una alternativa robusta y de bajo costo para los niños grandes, LogiXML cuenta con paneles de control e informes ad hoc en una plataforma .NET. Los hemos estado usando desde fines de 2006 cuando Pentaho recién estaba comenzando, pero no lo he visto en mucho tiempo.

4

Empecé a usar MS Reporting Services hace muchos años y me encanta. No he probado la solución de informes de Penaho, así que no puedo comentar al respecto. Tampoco probé ni Analysis Services ni la alternativa de Pentaho.

Recientemente necesité una solución ETL y al estar familiarizado con MSSQL y MSRS parecía obvio que lo revisaría y probablemente elegiría MS Integration Service. Pero para mí, MSIS fue horrible. Principalmente porque no fue intuitivo. Después de pasar un par de días tratando de aprender la herramienta, decidí buscar una alternativa y encontré Pentaho Data Integration, anteriormente conocida como Kettle. Lo tuve funcionando en cuestión de minutos e inmediatamente creé mi primera transformación. Simplemente funciona.

Es cierto que mis necesidades son bastante simples, pero el rendimiento ha sido excelente y la comunidad parece ser muy útil.

+0

[Hay una propuesta de un sitio de preguntas y respuestas dedicado para Business Intelligence. Siga, publique y respalde para obtenerlo.] (Http://area51.stackexchange.com/proposals/70503/business-intelligence?referrer = EPHSm8-3avvaMxLjdRIeNg2) – bonCodigo

8

Advertencia: hay numerosos sitios que enumeran las numerosas deficiencias, errores y molestias con SSIS. No estoy seguro de por qué SSIS salió en la parte superior con la publicación, pero antes de apostar a su proyecto, mire lo que la gente tiene que decir en la blogósfera. Según mi experiencia, hay 20: 1 despotricando sobre lo horrible que es trabajar con SSIS. También puedo estar de acuerdo, actualmente estoy buscando alguna alternativa.

+5

SSIS tiene un motor muy bueno (rápido/potente), pero tiene uno de los diseñadores más picantes con los que he trabajado en mi vida. Hay innumerables molestias pequeñas, p. tiene una función DERECHA(), pero no IZQUIERDA()! –

+4

El problema con SSIS es la curva de aprendizaje, es como golpear una pared de ladrillos. Sin embargo, una vez que lo ha aprendido, se vuelve más fácil, aunque la depuración sigue siendo bastante difícil. Me aseguraría de tener un diseño de paquete maestro/hijo y mantener cada paquete lo más pequeño posible (dentro de lo razonable). –

+1

@adolfgarlic: Claro, hay una "izquierda". Se llama SUBSTRING() –

0

Recientemente probé pentaho open source BI. Encontré que es extremadamente torpe. No fue muy intuitivo y el tiempo de desarrollo tomó mucho más tiempo.

Es bastante diferente de las soluciones Oracle o ms BI. Tal vez la edición empresarial es mejor.

4

He usado SSIS y Pentaho Kettle, y recomiendo usar Pentaho Kettle para su herramienta ETL en lugar de SSIS.

Mis razones: -el flujo de SSIS es tarea por tarea. Kettle te hace pensar en filas de datos que fluyen a través del sistema. El enfoque de Kettle me parece mucho más intuitivo. -SSIS está poco documentado. Esto pasa. Pero parece que hay un montón de chasquidos y ajustes de variables. Muy complejo. Pentaho tiene un foro comunitario que es bastante útil. -Espero que Pentaho se integre con múltiples tipos de bases de datos, incluido SQL Server. También puedes usar JDBC, lo cual es bueno. Además, lo he usado para ir entre SQL Server y Oracle por un lado y Vertica por el otro. Tiene un cargador a granel disponible en Vertica. Eso es bastante bueno. -Me ha resultado muy, muy difícil hablar en términos relativos para obtener un paquete SSIS para que se ejecute en un servidor. Simplemente no valía la pena mi tiempo. -Me resulta bastante fácil para Pentaho enviar una advertencia o un mensaje de error a una persona o lista de personas. -Pentaho permite realizar tareas en JavaScript para cosas que necesitan un poco de lógica. Simple y fácil de hacer con un idioma que la mayoría de nosotros hemos encontrado.

7

¿Hay información aquí? No he probado Pentaho pero y estoy planeando verificarlo. Soy un experimentado consultor de MS BI, que lo usa desde 1998. SSIS es muy rápido y muy poderoso, pero las críticas son acertadas. Encontré los siguientes problemas con SSIS:

(1) Es difícil de depurar, se obtienen errores crípticos que pueden no dar ninguna pista sobre qué y dónde está realmente el problema.

(2) Por un comentario anterior, ¡es el entorno de desarrollo más chiflado de todos los tiempos! No tengo idea de lo que están pensando.

(a) Cree una tabla con 100 o más columnas y coloque una fusión en ella. Ahora regrese y trate de hacer una actualización de la combinación de combinación (como pasar una nueva columna). Puede tardar varios minutos, incluso en la máquina más rápida después de hacer clic en Aceptar en la combinación de combinación para guardar el cambio. Tengo un gran flujo de datos con muchos registros amplios y muchas combinaciones de fusión. Agregar una columna al flujo de datos lleva más de medio día. Actualizo una combinación de fusión y luego tengo que hacer otra cosa y volver a comprobar 5-10 minutos más tarde para ver si se ha completado. La respuesta de Microsoft a esto es dividir su paquete en múltiples paquetes, colocar los datos en una tabla o binario entre ellos. Bueno, si va al disco entre todos los pasos, ¡puede estar bien hacer todo en SQL! Uno de los propósitos principales de una herramienta de ETL es guardar todo esto en la memoria y evitar la E/S del disco.

(b) se bloquea El diseñador absolutas veces, perdiendo todo su trabajo desde el pasado guardar (I hacer ctrl-S en mi sueño ahora a causa de esto)

(c) que tenía que averiguar un corte y generar XML de paquete SSIS en Excel para amplios registros. Tengo un cliente de atención médica donde más de 600 registros de columna son comunes. ¡Si intenta definir un formato de archivo con 600 columnas en SSIS, debe escribir cada columna en una a la vez! Incluso el acceso a MS le permite cortar y pegar un diseño de una hoja de cálculo en un diseño de archivo, pero no en SSIS. Así que tuve que generar el XML del diseño y pegar el código XML en el lugar correcto del paquete. Una manera fea de hacerlo, pero ahorró días enteros de trabajo y muchos errores.

(d) De forma similar a (c), si necesita recortar todas sus columnas y tiene que decir más de 600, ¿adivina qué? En el componente de la columna derivada, debe escribir trim (columna1) ¡más de 600 veces! Ahora hago todas las transformaciones simples como esta en la consulta SQL para obtener los datos, ya que pueden generarse fácilmente desde una hoja de Excel.

(e) Hay muchas cosas peculiares, componentes que se vuelven invisibles, a veces se abre el paquete y todos los componentes se reorganizan completamente incoherentemente.

(f) La característica de FTP, posiblemente una de las cosas más comunes que necesita en ETL, es débil y solo es compatible con FTP simple y plano que nadie usa. Todo el mundo en estos días usa SFTP, FTPS, https, etc. Así que casi todas las implementaciones requieren el uso de una aplicación de transferencia de archivos impulsada por la línea de recomendación de terceros que el paquete debe llamar.

(g) Tratando de CYA, similar a la seguridad ridícula en Windows Vista, Microsoft ha hecho extremadamente difícil promover un paquete de SSIS de un entorno a otro. De manera predeterminada, esta cosa estúpida de "cifrar información confidencial con la clave de usuario" de seguridad, lo que significa que debe ejecutarse bajo la misma cuenta en el entorno que lo está moviendo como el entorno que desarrolló, algo que rara vez es el caso. Hay mejores formas de configurar, pero siempre intenta volver a esta protección de seguridad completamente inútil.

(h) Por último, la mayoría de estos problemas se encuentran ahora en la tercera versión, lo que indica claramente que Microsoft no tiene previsto arreglarlos.

(i) La depuración no es tan fácil como en otros idiomas.

SSIS todavía tiene una gran cantidad de beneficios, pero no sin algunos dolores.

+0

Esta es información valiosa, gracias. –

+0

Estoy de acuerdo con muchos de los puntos planteados sobre el SSIS anterior. Estoy desconcertado de por qué MS puso tanto empeño en crear un producto completamente nuevo para reemplazar a DTS en 2005 y básicamente lo dejó así. Una de las muchas cosas que me frustraron fue la ausencia de conectores para otros productos de MS, por ejemplo, no existe un conector de fuente de datos de SharePoint a pesar de ser una fuente de datos muy común en estos días (más extrañamente MS publicó una conexión de SharePoint no compatible como una muestra de código, pero nunca invirtió el esfuerzo requerido para hacerla parte del producto principal). – Nathan

3

un par de puntos para añadir

  • Aunque hay una versión de la ventana de todas las herramientas de Pentaho la configuración en Windows es onerosa. Pentaho (especialmente el inicio y parada del servidor que está separado de la herramienta de la GUI) se usa generalmente en Linux, no en Windows Shop, y existe una curva de aprendizaje empinada que va de Windows a Linux.
  • Cualquier herramienta tiene una curva de aprendizaje cuando te desplazas hacia ella. Cuando te acostumbras a hacer clic siempre en Aceptar y refrescar los metadatos cuando tienes problemas, SSIS no es tan malo. Pentaho puede ser escamoso, también.

Las preguntas de la herramienta deben abordarse en términos de preguntas culturales más amplias: ¿qué tipo de tiendas usan herramientas de código abierto? en mi experiencia, descubrí que aunque las tiendas de Microsoft parezcan más rígidas, cuando tienes problemas con una cadena de conexión en una tienda de Microsoft puedes obtener ayuda ... en las tiendas Pentaho y Linux es más DYI.

Por cierto, ten cuidado con los vendedores de Pentaho que hacen demos: ¡todas las cosas que demuestran son mucho más difíciles de conseguir de lo que parece! :)