Actualmente estoy depurando un script de cerdo. Me gustaría definir una tupla en el archivo Pig directamente (en lugar de la función básica "Cargar").Definir datos de tupla en el script de cerdo
¿Hay alguna manera de hacerlo?
Busco algo así:
A= ('name#bob'','age#29';'name#paul','age#12')
El vertedero Volverá:
('bob',29)
('paul',12)
Si ha cargado algunos datos, puede crear tuplas usando TOTUPLE: http://pig.apache.org/docs/r0.10.0/func.html#totuple –
Solo quiero definir una tupla sin usar LOAD funciones. –
Puede definir parámetros en un script porcino con '% declare', pero no creo que tenga permiso para crear datos sobre la marcha (sin cargarlo desde el disco hdfs/local) –