Tengo una matriz numpy simple, para cada fecha hay un punto de datos. Algo como esto:¿Hay manera fácil en Python para extrapolar los puntos de datos al futuro?
>>> import numpy as np
>>> from datetime import date
>>> from datetime import date
>>> x = np.array([(date(2008,3,5), 4800), (date(2008,3,15), 4000), (date(2008,3,
20), 3500), (date(2008,4,5), 3000) ])
¿Hay manera fácil extrapolar puntos de datos para el futuro: la fecha (2008,5,1), fecha (2008, 5, 20), etc? Entiendo que se puede hacer con algoritmos matemáticos. Pero aquí estoy buscando algo de fruta baja. En realidad, me gusta lo que hace numpy.linalg.solve, pero no parece aplicable para la extrapolación. Quizás estoy absolutamente equivocado.
En realidad, para ser más específico, estoy construyendo un gráfico de quemaduras (término xp): 'x = date and y = volumen de trabajo por hacer', así que tengo los sprints ya realizados y quiero visualizar cómo funcionarán los sprints futuros si la situación actual persiste. Y finalmente quiero predecir la fecha de lanzamiento. Por lo tanto, la naturaleza del "volumen de trabajo por hacer" es que siempre baja en los gráficos de quemado. También quiero obtener la fecha de lanzamiento extrapolada: fecha en que el volumen se vuelve cero.
Esto es todo para mostrar al equipo de desarrollo cómo van las cosas. La precisión no es tan importante aquí :) La motivación del equipo de desarrollo es el factor principal. Eso significa que estoy absolutamente bien con la técnica de extrapolación muy aproximada.
Cuando buscó en Google para "estadísticas de python", ¿qué encontró? ¿Alguna pregunta sobre alguno de los paquetes estadísticos que encontraste? –
Es difícil hablar de extrapolación, sin conocer la naturaleza de los datos en cuestión. Lo anterior, hasta donde se puede ver, podría ser cualquier cosa (sin excluir los valores aleatorios), por lo que hablar de cualquier enfoque práctico sería solo especular. Refina la pregunta – Rook
¡tienes toda la razón! refinado. – maplpro