2010-01-24 14 views
20

Estoy buscando una biblioteca de agrupamiento ligera en java. No necesito cientos de clúster algo en esa biblioteca solo 5 a 7 algo estaría bien para mí.Java Clustering Library

Estoy seguro, usted va a preguntar: "qué tipo de algo necesitas y con qué propósito" :). Solo necesito hacer una clasificación de mis datos con la ayuda de la agrupación. Por ejemplo, K significa.

P.S: Sé de weka pero no quiero usarlo, ya que no es específicamente para clústeres solamente.

+1

¿Qué quieres decir con agrupamiento? Es weka sth. ¿para ti? – Karussell

+0

Lo siento, no recibí tu respuesta. y ¿qué es eso? – user238384

+0

Nota para referencia futura ... en el desarrollo de software, "clustering" generalmente significa http://en.wikipedia.org/wiki/Cluster_%28computing%29 – skaffman

Respuesta

-1

Apache Mahout implementa muchos algoritmos de agrupamiento, a través de Hadoop. Es un poco pesado para lo que quiere, pero: http://cwiki.apache.org/MAHOUT/syntheticcontroldata.html

También es posible que pueda desenterrar y adaptar el código de agrupación de usuarios de la clase TreeClusteringRecommender de Mahout, que utiliza el clúster para propósitos del motor de recomendación.

+0

lo leí. Es una muy grande y compleja :( – user238384

0

Me gustaría echar un vistazo a JUNG. Tiene una serie de algoritmos de agrupación implementados, aunque no estoy seguro de si K-means es uno de ellos.

Otra opción podría ser echar un vistazo a Knime, un editor de flujo de trabajo basado en Eclipse. Esto incluye varias primitivas de agrupación que puede usar como parte de un flujo de trabajo, incluidos K-means.

+0

Para los interesados, JUNG tiene clustering k-means: http://jung.sourceforge.net/doc/api/edu/uci/ics/jung/algorithms/util/KMeansClusterer.html – sdasdadas

0

Existen algunos algoritmos de clústeres de código abierto en Java disponibles aquí, disponibles bajo la GPL. Requiere la biblioteca Java Colt (para matrices). http://open.trickl.com/

+0

Voy a probar esto, se parece a uno para mí: D gracias – Tohid

0

Existe también ELKI, un proyecto de la universidad de código abierto similar a WEKA, pero con el foco en el análisis de conglomerados y la detección de las demás en lugar de algoritmos de aprendizaje automático. Es bastante avanzado, usa estructuras de índice para la eficiencia y tiene al menos una docena de algoritmos de agrupamiento.

-1

El software Cytoscape tiene varios complementos que implementan algoritmos de agrupamiento para redes y datos numéricos (Nemo, MCODE, clusterMaker, etc.). Todos los complementos son de código abierto.

-1

Si desea que algunos algoritmos de agrupamiento básicos en Java, se puede comprobar mi software:

http://www.philippe-fournier-viger.com/spmf/

Ofrece una implementación de K-medias y un algoritmo de agrupamiento jerárquico.

Los otros algoritmos ofrecidos son para minería de patrones. Totalmente, hay 47 algoritmos. Pero solo 2 para agrupar. Otra cosa: hay una GUI simple para lanzar los algoritmos.