para unir dos tablas de Amazon DynamoDB
El ejemplo siguiente se asigna dos mesas colmena para los datos almacenados en Amazon DynamoDB. Luego llama a una combinación a través de esas dos tablas. La unión se calcula en el clúster y se devuelve. La unión no tiene lugar en Amazon DynamoDB. Este ejemplo devuelve una lista de clientes y sus compras para los clientes que han realizado más de dos pedidos.
CREATE EXTERNAL TABLE hive_purchases(customerId bigint, total_cost double, items_purchased array<String>)
STORED BY 'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler'
TBLPROPERTIES ("dynamodb.table.name" = "Purchases",
"dynamodb.column.mapping" = "customerId:CustomerId,total_cost:Cost,items_purchased:Items");
CREATE EXTERNAL TABLE hive_customers(customerId bigint, customerName string, customerAddress array<String>)
STORED BY 'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler' TBLPROPERTIES ("dynamodb.table.name" = "Customers",
"dynamodb.column.mapping" = "customerId:CustomerId,customerName:Name,customerAddress:Address");
Select c.customerId, c.customerName, count(*) as count from hive_customers c
JOIN hive_purchases p ON c.customerId=p.customerId
GROUP BY c.customerId, c.customerName HAVING count > 2;
¿Es esta tarea? Si es así, por favor marqúelo como tal (no intente ser malo, pero solo lo revise). – Kiril
No es tarea; Intenté encontrar la pregunta constructiva más sencilla en la que pudiera pensar después de pasar algún tiempo intentando comprender los modelos NoSQL y no relacionales ... –