2012-09-21 20 views
5

Estoy procesando datos, donde obtengo información de la API de reposo, en función del valor de un campo.¿Cómo uso la memoria caché en kettle pentaho?

Ahora, el valor puede repetirse para ese campo y si ya he obtenido los datos para ese valor, desde REST, me gustaría reutilizar ese valor y guardar una llamada API (operación más lenta en la transformación).

es es posible? si es así, ¿cómo?

Saludos Ajay

+0

¿el mismo valor siempre produce el mismo resultado de la API REST? Entonces, ¿qué ocurre si realiza una transformación de preprocesamiento donde encuentra todos los valores de solicitud distintos? Pídalos a todos y use un paso de Búsqueda de oleoductos para obtener los resultados en su oleoducto principal. ¿Necesitas ayuda con esto? – RFVoltolini

Respuesta

2

@RFVoltini tienes razón, tal vez podríamos tratar de configurar un servidor H2 db para este purpouse: http://type-exit.org/adventures-with-open-source-bi/2011/01/using-an-on-demand-in-memory-sql-database-in-pdi/

otra opción es usar memcached en Java: http://sacharya.com/using-memcached-with-java/

+0

Estaba pensando ahora, y un caché puede ser un exceso para esta tarea (ver mi comentario sobre la pregunta). Pero de todos modos, estoy interesado en cómo implementar un caché genérico en PDI. Echaré un vistazo a tus enlaces. Gracias. – RFVoltolini

2

I He hecho una transformación de ejemplo, que se obtiene de los nombres de los países de un servicio web por códigos de país. He utilizado la idea de que solo necesita obtener los nombres/códigos de país distintos en el servicio web y luego buscarlos en su canalización principal.

Tome un vistazo a este ejemplo: https://docs.google.com/open?id=0B-AwXLgq0XmaV0V0cHlfTFZlVUU y ver si este método se aplica a usted.

Cuestiones relacionadas