Quiero crear una tabla Hive donde los archivos de texto de entrada se atraviesan en múltiples subdirectorios en hdfs. Así ejemplo tengo en hdfs:Colmena: creación de tablas con varios archivos con múltiples directorios
/testdata/user/Jan/part-0001
/testdata/user/Feb/part-0001
/testdata/user/Mar/part-0001
and so on...
Si quiero crear un usuario en la tabla colmena, pero tienen que ser capaces de atravesar los subdirectorios de usuario, se puede hacer esto? Intenté algo como esto, pero no funciona;
CREATE EXTERNAL TABLE users (id int, name string)
STORED AS TEXTFILE LOCATION '/testdata/user/*'
Pensé que agregar el comodín funcionaría pero no lo hace. Cuando traté de no usar el comodín todavía no funciona. Sin embargo, si copio los archivos en el directorio raíz del usuario, entonces funciona. ¿No hay forma de que Hive atraviese los directorios secundarios y tome esos archivos?
Esto no funcionó. En realidad, debería haber mencionado que estoy ejecutando CDH3u1 en este momento. – user706794
Defina "No funcionó". También debería mencionar que necesitaría cambiar sus nombres de directorio a month = Jan etc ... –