Tengo un trabajo Elastic Map Reduce que está escribiendo algunos archivos en S3 y quiero concatenar todos los archivos para producir un archivo de texto único.¿Es posible ejecutar hadoop fs -getmerge en S3?
Actualmente estoy copiando manualmente la carpeta con todos los archivos a nuestros HDFS (fs hadoop copyFromLocal), entonces yo estoy corriendo hadoop FS y FS -getmerge hadoop copyToLocal para obtener el archivo.
¿Hay alguna forma de utilizar hadoop fs directamente en S3?
'fs Hadoop -getmerge' sólo pueden fusionarse para el sistema de archivos local, no s3 – justderb