2011-07-09 8 views
5

Estoy intentando ejecutar un programa MPI simple en 4 nodos. Estoy usando OpenMPI 1.4.3 ejecutándose en Centos 5.5. Cuando presento el comando MPIRUN con el archivo host/máquina, no obtengo salida, recibo una pantalla en blanco. Por lo tanto, Tengo que matar el trabajo..Error de OpenMPI 1.4.3 mpirun hostfile

utilizo el siguiente orden de marcha:: mpirun --hostfile HostFile -np 4 new46

OUTPUT ON KILLING JOB: 
mpirun: killing job... 
-------------------------------------------------------------------------- 
    mpirun noticed that the job aborted, but has no info as to the process that caused 
    that situation. 
    -------------------------------------------------------------------------- 
    mpirun was unable to cleanly terminate the daemons on the nodes shown 
    below. Additional manual cleanup may be required - please refer to 
    the "orte-clean" tool for assistance. 
    -------------------------------------------------------------------------- 
    myocyte46 - daemon did not report back when launched 
    myocyte47 - daemon did not report back when launched 
    myocyte49 - daemon did not report back when launched 

Aquí es el programa MPI Estoy tratando de ejecutar en 4 nodos

************************** 

    if (my_rank != 0) 
    { 
    sprintf(message, "Greetings from the process %d!", my_rank); 
    dest = 0; 
    MPI_Send(message, strlen(message)+1, MPI_CHAR, dest, tag, MPI_COMM_WORLD); 
    } 
    else 
    { 
    for (source = 1;source < p; source++) 
    { 
    MPI_Recv(message, 100, MPI_CHAR, source, tag, MPI_COMM_WORLD, &status); 
    printf("%s\n", message); 
    } 

    **************************** 

Mi HostFile se ve así:

[[email protected] ~]$ cat hostfile 
    myocyte46 
    myocyte47 
    myocyte48 
    myocyte49 
    ******************************* 

Ejecuto el programa MPI anterior de forma independiente en cada uno de los nodos y compi dirigido y funcionó bien. Tengo este problema de "Daemon no informó cuando se lanzó" cuando uso el archivo host. Estoy tratando de descubrir cuál podría ser el problema.

Gracias!

Respuesta

1

creo que estas líneas

myocyte46 - daemon did not report back when launched 

son bastante claro - usted está teniendo problemas ya sea el lanzamiento de los demonios MPI o comunicarse con ellos después. Entonces, debes comenzar a buscar redes. ¿Puedes enviar ssh sin contraseña a estos nodos? ¿Puedes regresar? Dejando de lado el programa MPI, ¿puedes

mpirun -np 4 hostname 

y obtener algo?

+0

Gracias. Sí, pude ir y venir entre nodos. Parece que el administrador había dejado el cortafuegos en funcionamiento y que apagarlo parece funcionar. Además, anoté en algunos de los foros de Linux que sugirieron agregar./etc/bashrc como el primer elemento en el perfil bashrc. – Ashmohan

Cuestiones relacionadas