Necesito establecer el número de reductores mientras hago una operación de unión en Hive. No quiero establecer la misma cantidad de reductores en cada trabajo de combinación que tengo. ¿Cómo puedo mencionarlo como argumento? Gracias por adelantado.Unir la colmena establecer el número de reductores
Respuesta
En la parte superior del archivo de comandos, poner esto:
set mapred.reduce.tasks=128
La única manera de hacer esto actualmente es dividir su un script Colmena en varias partes donde pesada se une serían puestos en un guión diferente. Luego, para combinaciones pesadas, puede especificar una gran cantidad de reductores. Para llevar a cabo todas estas secuencias de comandos de una sola vez, puede utilizar hive -f
opción con todos los guiones que figuran en una secuencia de comandos shell como se muestra a continuación: #example of shell script RunMyHQL.sh $HIVE_HOME/bin/hive -f /somepath/script1.hql $HIVE_HOME/bin/hive -f /somepath/script2.hql $HIVE_HOME/bin/hive -f /somepath/script3.hql
A continuación, asigne los permisos adecuados para presentar RunMyHQL.sh chmod u+x /somepath/RunMyHQL.sh
Entonces Ejecute el script de shell ./RunMyHQL.sh
Cada uno de script1, script2 y script3 puede contener el número deseado de correlacionadores y reductores. Si esto necesita ejecutarse en intervalos específicos una y otra vez, entonces le sugiero que implemente el flujo de trabajo de Oozie.
- 1. número de reductores para 1 tarea en MapReduce
- 2. Python: el uso de `copyreg` para definir reductores para los tipos que ya tienen reductores de
- 3. java.sql.SQLException: org.apache.thrift.transport.TTransportException en la colmena?
- 4. Cómo utilizar la colmena con otro usuario
- 5. Hadoop envía el registro a todos los reductores
- 6. explotar el conjunto de Struct en Colmena
- 7. Reductores disponibles en Elastic MapReduce
- 8. Establecer el número predeterminado de lugares decimales para la impresión
- 9. Colmena QL Salvo cláusula
- 10. Colmena: análisis JSON
- 11. Agregar número para establecer
- 12. Cómo transferir la tabla mysql a colmena?
- 13. ¿Cuál es la colmena: Código de retorno de 2 org.apache.hadoop.hive.ql.exec.MapRedTask
- 14. ¿Cómo compilo una UDF Colmena
- 15. Unir similitud usando Hadoop
- 16. ¿Cómo establecer el número de líneas para un QTextEdit?
- 17. ¿Cómo puedo establecer el número de subprocesos en Quartz.NET threadpool?
- 18. establecer el número máximo de líneas en uilabel
- 19. ¿Puedo establecer el número máximo de filas en ung DataView
- 20. ¿Cómo puedo unir un número entre corchetes con expresiones regulares
- 21. C#: cómo establecer el número de versión del ensamblaje
- 22. Establecer el número de línea a una variable en Emacs
- 23. Programativamente obtener 14 ruta de la colmena en Sharepoint 2010
- 24. Establecer el número máximo de filas visibles para listview
- 25. GridView: cómo establecer el número de filas para mostrar
- 26. unir/unir matrices en C#
- 27. cómo seleccionar datos de la colmena con una partición específica?
- 28. SQL unir tres tablas, unir a la precedencia
- 29. Para unir o unir todo, esa es la pregunta
- 30. Por qué: ayudar a ignorar: establecer el número en .vimrc?
Esto lo configurará para todas las partes de la consulta en lugar de para una unión específica. No hay forma de hacerlo por cada unión (al menos no todavía) –
Lo necesito para cada combinación. Quiero decir que tengo varias consultas de unión en mi script, cada una con diferentes tamaños de entrada. Por lo tanto, quiero establecer una gran cantidad de reductores en combinaciones pesadas y menos reductores, donde la unión tiene menos datos. – Sandeep
Necesito algo como esto. HIVE_HOME/bin/hive -set mapred.reducer.tasks = "comando". Para que pueda ejecutar el comando colmena desde la terminal. –
Sandeep