Estoy trabajando en un proyecto donde necesitamos más rendimiento. Con el tiempo, hemos seguido evolucionando el diseño para trabajar más en paralelo (tanto enhebrado como distribuido). Luego, el último paso ha sido mover parte de él en una máquina nueva con 16 núcleos. Me doy cuenta de que tenemos que volver a pensar cómo hacemos las cosas para escalar a esos muchos núcleos en un modelo de memoria compartida. Por ejemplo, el asignador de memoria estándar no es lo suficientemente bueno.Escalar aplicaciones multiproceso en máquinas multinúcleo
¿Qué recursos recomendaría la gente?
Hasta ahora, he encontrado que la columna de Sutter, el Dr. Dobbs, es un buen comienzo. Acabo de recibir The Art of Multiprocessor Programming y The O'Reilly book on Intel Threading Building Blocks