Estoy tratando de obtener algunos valores de JSON anidado para millones de filas (tabla de 5 TB +). ¿Cuál es la forma más eficiente de hacer esto?Colmena: análisis JSON
Aquí se muestra un ejemplo:
{"country":"US","page":227,"data":{"ad":{"impressions":{"s":10,"o":10}}}}
necesito estos valores fuera de la JSON anterior:
Country Page impressions_s impressions_o
--------- ----- ------------- --------------
US 2 10 10
Ésta es la función json_tuple de la colmena, no estoy seguro si esto es la mejor función. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject