2011-03-07 5 views
5

Estoy construyendo un proyecto de código abierto que medirá si las diferencias en la tasa de clics de varios anuncios de Facebook son significativamente significativas. Tomando la inspiración de http://adwords.google.com/support/aw/bin/answer.py?hl=en&answer=167743, escribí el siguiente código ruby ​​(supongamos que cualquier método no definido dentro de hacer exactamente lo que dicen).¿Cómo se mide la importancia estadística de un porcentaje de clics?

La tasa de clics se define como el porcentaje de personas que hacen clic en un anuncio en comparación con el número de personas que ven una impresión de ese anuncio.



    # ** exponentiation 
    # * multiplication 
    #/division 
    def standard_deviation 
    (experiment_ctr/(control_ctr**3) * (no_of_clicks_for_control + 
             no_of_clicks_for_experiment - product_of_ctrs * 
             total_no_of_impressions)/product_of_impressions) ** 0.5 
    end 

def z_score 
    (ratio_of_experiment_ctr_to_control - 1)/standard_deviation 
    end 

 

He copiado el código de desviación estándar del sitio web de Google, pero me parece sospechoso. ¿Alguien tiene alguna idea de si esto es correcto o no?

Muy apreciado.

+0

¿Qué idioma es ese? No reconozco la sintaxis. También etiquetaría la pregunta con el idioma. – Amy

+0

Es ruby. Lo etiquetaré ahora. –

+0

Jack, es posible que desee probar en stats.stackexchange.com. Esa fórmula definitivamente no me resulta familiar (control_ctr^3? ¿Eh?), Pero eso no significa que no sea correcta (o aproximadamente correcta). Las personas en stats.stackexchange.com podrán decírtelo. –

Respuesta

2

No le resulta familiar porque no es la prueba de significancia ordinaria que la mayoría de la gente está acostumbrada a ver. La mayor prueba de significación se formulan por (groseramente más generalizada, por favor no llamas):

  1. calcular una muestra estadística, X
  2. determinar el valor esperado de esa estadística, E
  3. determinar la desviación estándar de esa estadística , S
  4. calcular la estadística de prueba T = (X - E)/S
  5. determinar si T es significativa basada en la distribución hipotética de T.

Para las pruebas de significancia media comunes, E es la media de la muestra y S es la desviación estándar de la muestra con la que estamos más familiarizados.

Esta prueba de significancia se basa en alguna razón para la estadística de muestra. La fórmula (E-C)/C proporcionada por Google. Esta estadística, según Google, tiene un valor esperado de (1/(1-p)) - 2 y tiene una desviación estándar de (p/((C + E) * (1-p)^3))^0.5 . Entonces, esos deberían ser los números conectados a la fórmula T de arriba. El z-score en la explicación de Google.

Por lo tanto, a pesar de que la fórmula parece impar, se basa en fundamentos de sonido. Deberías poder usarlo con confianza.

Cuestiones relacionadas