Tiene Kepler 2x o 4x el ancho de banda de Fermi al acceder a la memoria compartida?Ancho de banda de memoria compartida Fermi vs Kepler GPU
guía de programación establece: "Cada banco tiene un ancho de banda de 32 bits por dos reloj ciclos" (para 2.X), y "Cada banco tiene un ancho de banda de 64 bits por reloj ciclo" (3. X), entonces 4x está implícito?
@Tom: Estoy citando desde 5.0 PG. (De hecho, la oración sobre 3.X ancho de banda se ha agregado w.r.t 4.2 PG). En ambos casos, hay 32 bancos. Mi pregunta se debe en parte a la p81 de [esta presentación] (http://developer.download.nvidia.com/GTC/PDF/GTC2012/PresentationPDF/S0514-GTC2012-GPU-Performance-Analysis.pdf) donde dicen que el ancho de banda es x2. No veo ninguna referencia a diferentes relojes en 2.X y 3.X, y confío en que cuando se usa "ciclo de reloj", significa lo mismo en todas las capacidades de cálculo (como, por ejemplo, con rendimiento de instrucción también). Lo que estos ciclos de reloj están en Hz no es relevante para esta pregunta. –
La frecuencia del reloj es fundamental, ya que está hablando de anchos de banda que normalmente se miden en bytes/seg, yendo desde bytes/ciclo a bytes/seg. Requiere frecuencia de reloj. Estoy de acuerdo con que el documento no está claro y espero que se mejore la versión final de CUDA 5.0 (la versión que tiene es presumiblemente de la versión candidata). – Tom