Tengo la siguiente pregunta sobre la elección de funciones hash para filtros Bloom:Qué funciones hash para su uso en una floración filtrar
- que funciona para usar?
En casi todos los documento/papel se puede leer que las funciones hash utilizados en un Bloom filtran debe ser independiente y uniformemente distribuida.
Sé lo que se entiende por esto (distribución independiente y uniforme), pero tengo problemas para encontrar una argumentación o una discusión, cuyas funciones hash cumplen esos requisitos y, por lo tanto, son adecuadas. En una gran cantidad de publicaciones que he leído sobre sugerencias para el uso de FNV o Murmur hash función, pero no por qué (o al menos sin una prueba) son adecuados.
¡Gracias de antemano!
No he leído [Kirsch-Mitzenmacher-Optimization] (https://www.eecs.harvard.edu/~michaelm/postscripts/tr) -02-05.pdf) completamente pero en el papel hash_i = hash1 + ix hash2% p, donde p es un primo, hash1 y hash2 están dentro del rango de [0, p-1], y el conjunto de bits consiste en k * p bits . – cyber4ron