leí esto: http://spyced.blogspot.com/2009/01/all-you-ever-wanted-to-know-about.htmlBloomfilter y Cassandra = ¿Por qué se usa y por qué hasheado varias veces?
Mis preguntas:
1.) ¿Es correcto, que Cassandra sólo utiliza el filtro de floración, para averiguar la (tabla de cadenas Ordenado SST) que muy probablemente contiene la clave ? Como podría haber varias SST y Cassandra no sabe en qué SST podría estar una llave? Por lo tanto, para acelerar esta búsqueda en todos los SST, se utilizan filtros Bloom. ¿Es esto correcto? (Estoy tratando de entender cómo funciona Casandra ...)
2.) ¿Por qué las claves (como se explica en el enlace anterior) hasheñaron varias veces? ¿Es correcto que las claves necesiten procesarse con diferentes funciones Hash varias veces para obtener una mejor distribución aleatoria de los Bits? Si esto es incorrecto, ¿por qué una clave necesita ser hasheada varias veces? Esto costará ciclos de CPU? Si tengo la salida de varias funciones Hash, ¿qué se hace con los resultados? ¿Están ANDed o XORded? ¿Esto hace alguna diferencia?
3.) Usando MD5, ¿cuán grande es la diferencia de "Fales positivos usando el Bloomfilter" en comparación con SHA1 (que según los artículos se distribuye al azar)? ¿Por qué MD5 no se distribuye al azar?
Muchas gracias !! Jens
Muchas gracias !!! (Leí un artículo sobre Bloomfilters en mi idioma nativo y parecía dar algunos de los pasos juntos para una explicación más fácil, ahora realmente entiendo cómo funciona con las posiciones, gracias a su explicación y enlace. ¡Muchas gracias! – jens