Estoy ejecutando una tarea en modo pseudo-distribuido en mi computadora portátil de 4 núcleos. ¿Cómo puedo asegurarme de que todos los núcleos se usan efectivamente? Actualmente mi rastreador de trabajo muestra que solo se está ejecutando un trabajo a la vez. ¿Eso significa que solo se usa un núcleo?Utilización completa de todos los núcleos en el modo pseudo distribuido de Hadoop
Los siguientes son mis archivos de configuración.
conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
EDITAR : Según la respuesta, necesito agregar las siguientes propiedades en mapred-site.xml
<property>
<name>mapred.map.tasks</name>
<value>4</value>
</property>
<property>
<name>mapred.reduce.tasks</name>
<value>4</value>
</property>
mapred.map.tasks y mapred.reduce.tasks no controlan el # de tareas de asignación/reducción por nodo. Por favor, prueba y asegúrate antes de seleccionar una respuesta. –
@Praveen es correcto, pero dado que tiene 1 nodo, necesitará al menos sugerirle que también use más mapeadores, no solo aumente el máximo por rastreador. –
@Nemo Además de agregar los valores mapred. (Map | reduce) .tasks de 4 en mapred-site.xml, ¿ha cambiado los valores de mapreduce.tasktracker. (Map | reduce) .tasks.maximum para completar utilizar todos los núcleos? – AST