estoy usando PIG para generar grupos de tuplas de la siguiente manera:PIG: Obtener todas las tuplas de una bolsa agrupados
a1, b1
a1, b2
a1, b3
...
->
a1, [b1, b2, b3]
...
Esto es fácil y trabajo. Pero mi problema es conseguir lo siguiente: En los grupos obtenidos, me gustaría generar un conjunto de todas las tuplas de la bolsa del grupo:
a1, [b1, b2, b3]
->
b1,b2
b1,b3
b2,b3
esto sería fácil si pudiera nido "foreach" y en primer lugar iterate sobre cada grupo y luego sobre su bolsa.
Supongo que estoy malinterpretando el concepto y agradeceré su explicación.
Gracias.
Laurens es correcto. Esta UDF hace exactamente lo que necesita y también es mucho más eficiente que una solución pura basada en cerdo que utiliza un producto cartesiano. Por cierto, la URL ha cambiado: [UnorderedPairs] (http://datafu.incubator.apache.org/docs/datafu/1.2.0/datafu/pig/bags/UnorderedPairs.html) – matterhayes