No he podido encontrar esta función en ninguno de los paquetes estándar, así que escribí el siguiente. Sin embargo, antes de lanzarlo hacia Cheeseshop, ¿alguien sabe de una versión ya publicada? Alternativamente, sugiera cualquier mejora. Gracias.Tukey resumen de cinco números en Python
def fivenum(v):
"""Returns Tukey's five number summary (minimum, lower-hinge, median, upper-hinge, maximum) for the input vector, a list or array of numbers based on 1.5 times the interquartile distance"""
import numpy as np
from scipy.stats import scoreatpercentile
try:
np.sum(v)
except TypeError:
print('Error: you must provide a list or array of only numbers')
q1 = scoreatpercentile(v,25)
q3 = scoreatpercentile(v,75)
iqd = q3-q1
md = np.median(v)
whisker = 1.5*iqd
return np.min(v), md-whisker, md, md+whisker, np.max(v),
Por si sirve de algo, de matplotlib 'boxplot' http://matplotlib.sourceforge.net/api/pyplot_api.html#matplotlib.pyplot.boxplot efectivamente hace esto, aunque llamándolo simplemente para calcular los parámetros sería torpe, por decir lo menos ... –
El diagrama de cajas de Matlab NO calcula un resumen de 5 números. Q1 y la bisagra inferior son frecuentemente idénticos, ¡pero no siempre! El diagrama de caja calcula Q1 usando un método determinado (también hay muchos que eligen), pero no se garantiza que produzca la bisagra inferior de Tukey. – russellpierce
Cf. http: //stats.stackexchange.com/preguntas/51801/interpretación-raro-box-plot/51806? NoRedirect = 1 # comment101742_51806 – russellpierce