Estoy tratando de optimizar un software que básicamente ejecuta millones de pruebas. Estas pruebas se generan de tal manera que puede haber algunas repeticiones. Por supuesto, no quiero perder tiempo ejecutando pruebas que ya realicé si puedo evitarlo de manera eficiente.¿Frente al filtro Bloom?
Por lo tanto, estoy pensando en utilizar un filtro Bloom para almacenar las pruebas que ya se han ejecutado. Sin embargo, el filtro Bloom se equivoca en el lado inseguro para mí. Da falsos positivos. Es decir, puede informar que realicé una prueba que no hice. Aunque esto podría ser aceptable en el escenario en el que estoy trabajando, me preguntaba si existe un equivalente a un filtro Bloom, pero se equivoca en el lado opuesto, es decir, solo se dan falsos negativos.
He hojeado la literatura sin ningún tipo de suerte.
http://cstheory.stackexchange.com/questions/6596/a-probabilistic-set-with-no-false-positives –
Para completar, esto puede ser de su interés: https://github.com/ jmhodges/opposite_of_a_bloom_filter – Dave
Hay una cosa así con el nombre divertido "Opuesto a un filtro Bloom". Código: https://github.com/jmhodges/opposite_of_a_bloom_filter blog: http://www.somethingsimilar.com/2012/05/21/the-opposite-of-a-bloom-filter/ – ib84