2008-08-04 10 views
12

Estoy escribiendo una aplicación para ayudar a facilitar algunas investigaciones, y parte de esto implica hacer algunos cálculos estadísticos. En este momento, los investigadores están utilizando un programa llamado SPSS. Parte de la salida que se preocupan por el aspecto siguiente:¿Cómo puedo calcular estas estadísticas?

[Part of the SPSS output

Son realmente sólo se preocupa por los valores F y Sig.. Mi problema es que no tengo experiencia en estadísticas, y no puedo entender cómo se llaman las pruebas ni cómo calcularlas.

pensé que el valor F podría ser el resultado de la F-test, pero después de seguir los pasos que se indican en la Wikipedia, que tiene un resultado que era diferente de lo SPSS da.

+0

Alguien puede arreglar la imagen, está rompiendo el formato –

Respuesta

4

This website te pueden ayudar un poco más. También this one.

estoy trabajando desde una memoria bastante oxidada de un curso de estadística, pero aquí va nada:

cuando se está haciendo un análisis de varianza (ANOVA), que realmente calcular el estadístico F como la relación de la varianzas de media cuadrada "entre los grupos" y las varianzas de media cuadrática "dentro de los grupos". El segundo enlace anterior parece bastante bueno para este cálculo.

Esto hace que la estadística F mida exactamente qué tan potente es su modelo, porque la varianza "entre los grupos" es potencia explicativa, y la variación "dentro de los grupos" es un error aleatorio. High F implica un modelo altamente significativo.

Como en muchas operaciones estadísticas, usted vuelve a determinar Sig. usando la estadística F Aquí es donde su información de Wikipedia es muy útil. Lo que quiere hacer es usar los grados de libertad que le otorga SPSS, encuentre el valor de P adecuado en el que un F table le dará la estadística F que calculó. El valor P donde ocurre esto [F (tabla) = F (calculado)] es el significado.

Conceptualmente, un valor de significación menor muestra una capacidad muy fuerte para rechazar la hipótesis nula (que para estos fines significa determinar que su modelo tiene poder explicativo).

Lo siento a cualquier persona de matemáticas si algo de esto está mal. Estaré revisando para hacer ediciones!

Buena suerte para usted. Stats es divertido, tal vez no esta parte. =)

+0

Esta es una tabla de resultados multivariante, que descarta el ANOVA. Podría ser un MANOVA, un análisis de función discriminatorio o una de muchas otras pruebas multivariantes. Para resumir, las estadísticas son difíciles, trabaje en estrecha colaboración con los profesionales y realice el script de SPSS a través de python en lugar de crear el suyo propio. –

2

Las estadísticas son difíciles :-). Después de un año leyendo y volviendo a leer libros y periódicos, solo puedo decir con confianza que entiendo lo básico.

Es posible que desee investigar las bibliotecas ya preparadas para el lenguaje de programación que esté utilizando, porque son muchas las que se obtienen en matemáticas en general y estadísticas en particular (los errores de redondeo son un ejemplo obvio).

Como ejemplo, puede echar un vistazo a the R project, que es a la vez un entorno interactivo y una biblioteca que puede usar desde su código C++, distribuido bajo la GPL (es decir, si lo usa internamente y publica solo resultados, no necesita abrir su código).

2

En resumen: no haga esto a mano, enlace/use el software existente. Y la respuesta de sain_grocen es incorrecta.:(

Estas son todas las pruebas de significancia de las estimaciones de parámetros que se suelen utilizar en la respuesta multivariada Regresiones múltiples. No serían cosas simples que hacer fuera de un entorno de programación estadística. Sugeriría obtener el resultado de un pre -Programa estadístico existente, o utilizando uno que pueda vincular y usar ese código.

Me temo que la primera respuesta (sain_grocen) lo llevará por el camino equivocado. Su explicación es probable de un caso especial de con lo que estás tratando en realidad. La anova explicada en sus enlaces es para una única respuesta variable, en un diseño equilibrado. Estas no son las estadísticas F que estás viendo. Los nombres en tu salida (Pillai's Trace, Hotelling's Trace, ... .) son algunos de los mult versiones ivariate. Tienen distribuciones F bajo ciertas suposiciones. No puedo explicar el valor de los libros de texto aquí, le aconsejo que empiece por mirar "Análisis Estadístico Multivariable Aplicado" por Johnson and Wichern

0

¿Puede explicar más por qué SPSS no es una solución adecuada? al problema? ¿Es que genera tablas dinámicas como salida que son difíciles de manipular? ¿Es el costo del programa?

F-estadísticas pueden surgir a partir de cualquier número de pruebas particulares. La F es solo una distribución (sin apretar: una descripción de las "frecuencias" de grupos de valores), como una Normal (Gaussiana) o Uniforme. En general, surgen de razones de varianzas. Opinión: muchos estadísticos (incluido yo mismo), encuentran que las pruebas basadas en F son inestables (jerga: no robusta).

Las estadísticas de salida particulares (traza de Pillai, etc.) sugieren que el análisis original es un ejemplo de MANOVA, que como otros carteles describen es un procedimiento complicado y difícil de obtener.

Supongo que también, basado en el MANOVA, y el uso de SPSS, este es un proyecto de psicología o sociología ... si no, por favor, ilumínalo. Podría ser que otros modelos más simples en realidad podrían ser más fáciles de entender y más repetibles. Consulte a su grupo local de consultoría estadística de la universidad, si tiene uno.

¡Buena suerte!

3

Supongo por su pregunta que sus colegas de investigación desean automatizar el proceso mediante el cual se realizan ciertos análisis estadísticos (es decir, quieren procesar conjuntos de datos por lotes). Tiene dos opciones:

1) SPSS ahora se puede codificar a través de python (a partir de la versión 15): vaya a spss.com y busque python. Puede escribir secuencias de comandos de Python para automatizar análisis de datos y extraer valores clave de tablas dinámicas, y luego procesar las respuestas de la forma que desee. Esto tiene la virtud de permitir una comparación exacta entre los resultados de su secuencia de comandos python y los esfuerzos calculados a mano en SPSS de sus colaboradores. Por lo tanto, no tendrá que saber realmente ninguna estadística para hacer este trabajo (que es una ventaja clave)

2) Puede hacer esto en R, un entorno de estadísticas gratuito, que probablemente podría tener un script. Esto tiene la desventaja de que tendrá que aprender las estadísticas para asegurarse de estar haciéndolo correctamente.

+0

¡Es bueno saber que SPSS ahora es programable a través de Python directamente! ¿Puede generar resultados en texto plano ahora también? Además, R también es programable (aunque R o a través de Python, utilizando RPy). –

0

He aquí una explicación de MANOVA ouptput, desde un sitio muy bueno en las estadísticas y en SPSS:

de salida con la explicación: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

¿Cómo y por qué hacerlo MANOVA o MLG multivariante: (mismo camino como arriba, pero terminando en '/ manova.htm ')

Escribir software desde cero para calcular estos resultados sería largo y difícil; hay muchos problemas numéricos e inversiones de matriz que hacer.

Como dijo Henry, use scripts de Python, o R. Sugeriría trabajar con alguien que conozca SPSS si está creando scripts. Además, SPSS en sí mismo es capaz de exportar las tablas de salida a archivos usando algo llamado OMS. Un script dentro de SPSS puede hacer esto.

Descubre quién en tu grupo de investigación conoce SPSS y trabaja con ellos.

Cuestiones relacionadas