Hay muchas formas de escribir un programa de Python que calcule un histograma.python histogram one-liner
Por histograma, me refiero a una función que cuenta la ocurrencia de objetos en un iterable
y emite los conteos en un diccionario. Por ejemplo:
>>> L = 'abracadabra'
>>> histogram(L)
{'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2}
Una manera de escribir esta función es:
def histogram(L):
d = {}
for x in L:
if x in d:
d[x] += 1
else:
d[x] = 1
return d
¿Hay formas más concisas de escribir esta función?
Si tuviéramos comprensiones del diccionario en Python, podríamos escribir:
>>> { x: L.count(x) for x in set(L) }
pero desde Python 2.6 no los tiene, tenemos que escribir:
>>> dict([(x, L.count(x)) for x in set(L)])
Aunque este enfoque puede ser legible, no es eficiente: L es caminado varias veces. Además, esto no funcionará para generadores de vida única; la función debería funcionar igual de bien para generadores de iterador como:
def gen(L):
for x in L:
yield x
podríamos tratar de utilizar la función reduce
(RIP):
>>> reduce(lambda d,x: dict(d, x=d.get(x,0)+1), L, {}) # wrong!
Vaya, esto no funciona: el nombre clave es 'x'
, no x
. :(
que terminó con:
>>> reduce(lambda d,x: dict(d.items() + [(x, d.get(x, 0)+1)]), L, {})
(En Python 3, que tendría que escribir list(d.items())
en lugar de d.items()
, pero es hypothethical, ya que no hay reduce
allí.)
favor batir ¡Yo con un one-liner mejor y más legible!;)
"un trazador de líneas" y "más legible" no son mutuamente excluyentes, pero están cerca – msw
No es una respuesta, solo algunos comentarios: Primero, dict ((x, L.count (x)) para x en el conjunto (L)) funciona perfectamente bien (al menos en 2.6 o más, posiblemente versiones anteriores también), por lo que no es necesario introducir la lista adicional en el ejemplo anterior. En segundo lugar, si no te importan los one-liners, entonces este es un trabajo hecho a medida para el default del módulo de colecciones. Reemplace d = {} con d = collections.defaultdict (int) en su función de histograma original, y luego puede omitir el si x en d: bit. –
Peter Milley: ¡y la comprensión de casi dict funciona incluso en Python 2.5.2! gracias, no estaba al tanto de esta sintaxis – mykhal