Si comienzo mi núcleo con una rejilla de hilo (sólo 1 cuadra por ejemplo):¿Cómo se clasifican los hilos CUDA en urdimbres?
dim3 threads(16,16);
¿Cómo se esta rejilla ahora dividido en urdimbres? ¿Son las primeras dos filas de esta cuadrícula una distorsión, o las dos primeras columnas, o se ordena arbitrariamente? Supongamos una capacidad GPU Compute de 2,0 y un tamaño de urdimbre de 32.
Nota: "column-major order" asume que dim3 es una matriz, en lugar de una estructura. Una descripción más precisa es que '.x' es la variación más rápida de las dimensiones,' .y' es la segunda más rápida que varía, y '.z' varía más lentamente. La forma en que asocie '.x',' .y' y '.z' con filas, columnas, divisiones, compensaciones, niveles de árbol o cualquier otro direccionamiento dentro de la memoria depende de usted. – harrism