Estoy usando un código SQL bastante directo para calcular los coeficientes de regresión (intersección y pendiente) de algunos puntos de datos (x, y), usando mínimos cuadrados. Esto me da una buena línea de ajuste a través de los datos. Sin embargo, nos gustaría poder ver los intervalos de confianza del 95% y del 5% para la línea de mejor ajuste (las curvas a continuación).Intervalos de confianza de regresión lineal en SQL
link text http://www.curvefit.com/2a03be60.gif
lo que esto significa es que la línea verdadera tiene% de probabilidad de ser por debajo de la curva superior y 95% de probabilidad de estar por encima de la curva inferior 95. ¿Cómo puedo calcular estas curvas? Ya he leído la wikipedia, etc. y he hecho algunas búsquedas en Google, pero no he encontrado ecuaciones matemáticas comprensibles para poder calcular esto.
Editar: aquí está la esencia de lo que tengo ahora.
--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)
declare @slope real
declare @intercept real
--calculate slope and intercept
select
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr
Gracias de antemano.
Ese es un enlace muerto. – DatumPoint
¡Así es! Aunque no recuerdo nada de eso. Lo siento. – PowerUser