Jeff Atwood recientemente twitteó un enlace a una publicación de CodeReview en la que quería saber si la comunidad podría mejorar su fragmento de código "calculating entropy of a string". Explicó, "Estamos calculando la entropía de una cadena en algunos lugares en Stack Overflow como un significante de baja calidad".¿Cómo la entropía de una cadena de texto en inglés significa baja calidad?
La esencia de su método parece ser que si se cuenta el número de caracteres en una cadena única, que significa la entropía (código tomado de PieterG's answer):
int uniqueCharacterCount = string.Distinct().Count();
no entiendo cómo el el recuento único de caracteres significa la entropía de una cadena, y cómo la entropía de una cadena significa baja calidad. Me preguntaba si alguien con más conocimiento en esta área podría explicar lo que el Sr. Atwood está tratando de lograr.
Gracias!
¿No es la entropía de las cuerdas la diferencia entre dos cuerdas? Esto parece tratar de determinar una medida cuantificable de qué tan mal alguien deletreó sus palabras. Cuantos más errores ortográficos, peor es la publicación. – zzzzBov
asdfasdfasdfasdfasdfsdf –
@Hans Passant: abcdefghijklmnopqrstuvwxyz - de acuerdo con este algoritmo, mi cadena tiene una entropía mucho más alta, pero tiene una calidad similar. – Pandincus