2009-06-09 20 views
14

Busco a una implementación de Java de la Generalizado sufijo árbol (GST) con las siguientes características:generalizada sufijo árbol de Java Implementación

Después de la creación de la GST a partir digamos 1000 cuerdas me gustaría saber cuántos de estas 1000 cadenas contienen algunas otras cadenas 's'.

La búsqueda debe estar en silencio rápido, ya que necesito para aplicar la búsqueda sobre unos 100.000 candidatos cadenas de longitud media 10.

+0

Hola, me preguntaba si podrías decirme qué tipo de algas usaste al final, ¡¡tengo el mismo problema !!! – Julia

+0

mira aquí: http://stackoverflow.com/questions/9452701/ukkonens-suffix-tree-algorithm-in-plain-english/9513423#9513423 – YAMM

Respuesta

4

Prueba The Semantic Discovery Toolkit. Tiene una aplicación de texto/src/java/org/sd/texto/radixtree

+0

Er, ¿conoces alguna implementación (o incluso tutoriales)? para Token Suffix Trees? –

3

que creó un árbol de sufijos en Java que le permite agregar fácilmente su propia funcionalidad de búsqueda y otros algoritmos de coincidencia. La publicación de mi blog, Suffix Trees in Java, contiene una descripción general e instrucciones para descargar la última versión. Mi implementación de Java se basa en el artículo Fast String Searching With Suffix Trees de Mark Nelson.

actualización 2016-06-18

+0

La publicación del blog es informativa, pero la fuente no está actualmente disponible (Aug'2015) ya que apunta a https://svn.globalmentor.com/java/trunk/globalmentor-core/ que está protegida por contraseña. – codeDr

+0

Estoy haciendo todo lo posible para convertir nuestro repositorio de Subversion a Git y hacerlo público nuevamente. Eso debería suceder dentro de una semana o dos. Siéntase libre de hacerme ping si no está disponible para entonces. Aclamaciones. –

+0

El código fuente ahora está disponible a través de Git y en Maven Central. He actualizado la respuesta anterior con la nueva ubicación. –

Cuestiones relacionadas