2010-12-08 27 views

Respuesta

9

Parece que no entienden para qué es el paquete de Fórmula. Las fórmulas multiparte se pueden usar para significar lo que sea que el usuario/desarrollador quiera que signifique. La fórmula proporciona el azúcar sintáctico alrededor de la notación de fórmula más flexible provista por el paquete. Las fórmulas de varias partes no significan nada hasta que se procesa la fórmula para convertir la representación simbólica en matrices modelo o similar.

El ejemplo que cita en su respuesta "Respuesta" es y ~ x1 + X2 | z1 +z2 + z3. Esto es para un modelo de variables instrumentales ajustado por OLS de dos etapas. La parte posterior al | (z1 +z2 + z3) se interpreta por la función ivcoef() como los IV, mientras que la parte a la izquierda del | (x1 + x2) se interpreta como las covariables de regresión. ivcoef() construye dos matrices de modelos a partir de estas partes del RHS de la fórmula para permitir que se ajuste al OLS de dos etapas. La fórmula proporciona el código para manejar y manipular estas fórmulas multiparte, no especifica qué modelos estadísticos se usan para representar.

Otro ejemplo es la función hurdle() en el paquete pscl, que usa la funcionalidad de Fórmula. En estos modelos, la misma fórmula y ~ x1 + X2 | z1 +z2 + z3 se interpretaría de manera diferente; es decir, el bit z1 +z2 + z3 se usaría para el obstáculo cero (la parte binomial del modelo de obstáculo), mientras que el x1 + X2 se interpretaría y usaría para la parte de conteo del modelo de obstáculo.

Lo que quiero decir es que la Fórmula se puede interpretar de la manera que se desee si se está creando el software. Si usted es el usuario, necesita comprender el modelo que está siendo instalado antes de poder interpretar la Fórmula multiparte en términos del modelo estadístico. Como tal, no hay una respuesta para tu Q; no hay un significado en términos matemáticos para una fórmula de varias partes.

+0

+1: limpio como siempre. –

Cuestiones relacionadas