estoy tratando de optimizar algún código RK4 GCC C++ mediante__builtin_prefetch, ¿cuánto lee?
__builtin_prefetch
Estoy teniendo algunos problemas tratando de encontrar la manera de captación previa a toda una clase. No entiendo la cantidad de const void *addr
que se lee. De modo que tengo los siguientes valores de from
y to
cargados.
for (int i = from; i < to; i++)
{
double kv = myLinks[i].kv;
particle* from = con[i].Pfrom;
particle* to = con[i].Pto;
//Prefetch values at con[i++].Pfrom & con[i].Pto;
double pos = to->px- from->px;
double delta = from->r + to->r - pos;
double k1 = axcel(kv, delta, from->mass) * dt; //axcel is an inlined function
double k2 = axcel(kv, delta + 0.5 * k1, from->mass) * dt;
double k3 = axcel(kv, delta + 0.5 * k2, from->mass) * dt;
double k4 = axcel(kv, delta + k3, from->mass) * dt;
#define likely(x) __builtin_expect((x),1)
if (likely(!from->bc))
{
from->x += ((k1 + 2 * k2 + 2 * k3 + k4)/6);
}
}
Enlace: http://www.ibm.com/developerworks/linux/library/l-gcc-hacks/
No creo que haya mucho sentido en dicha micro-optimización, para fines que no sean el aprendizaje. Las CPUs modernas son muy buenas en la captación previa por sí mismas. – ronag
Probablemente, pero tengo 1 función que se llama casi mil millones de veces. – Mikhail