¿Hay alguna forma en los dispositivos CUDA 2.0 para deshabilitar la caché L1 solo para una variable específica? Sé que se puede deshabilitar la memoria caché L1 en tiempo de compilación agregando la marca -Xptxas -dlcm=cg
a nvcc
para todas las operaciones de memoria. Sin embargo, quiero desactivar la memoria caché solo para lecturas de memoria en una variable global específica para que todo el resto de la memoria se lea en la caché L1.CUDA deshabilitar la caché L1 solo para una variable
Basado en una búsqueda que he realizado en la web, una posible solución es a través del código de ensamblaje PTX.
¡Gracias! Eso está funcionando bien! – zeus2
@Reguj, ¿esto no es proporcionado por los encabezados de NVIDIA en cualquier lugar? – einpoklum
[este] (https://nvlabs.github.io/cub/classcub_1_1_cache_modified_input_iterator.html#details) puede ser de interés –