2011-10-05 4 views
12

Estoy aprendiendo el algoritmo de K-medoids, así que lamento si hago preguntas inapropiadas. Como sé, el algoritmo de K-medoids implementa un agrupamiento de K-means pero usa puntos de datos reales para ser centroide en lugar de medios matemáticos calculados.¿Dónde encontrar un software/herramienta de código abierto K-medoid (no k-means) confiable?

Al buscar en Google en línea, encontré una gran cantidad de herramientas k-means como GenePattern, geWengh, ... etc. pero no las k-medoids. Algunos buenos amigos me han mostrado que en Matlab, también hay uno escrito por algún usuario. Sin embargo, me temo que la herramienta implementada personal aún puede tener algunos errores o limitaciones. Por lo tanto, me pregunto si hay algunas herramientas/software de código abierto confiables y ampliamente utilizados que usen puntos de datos reales como centroides para agrupar. Necesito averiguar la información sobre los centroides reales, por lo que solo devolver los resultados de la agrupación no es suficiente. Prefiero sitios web en línea, pero si este no es el caso, estoy bien para instalarlo en mi máquina local. Muchas gracias,

Respuesta

10
  1. Un implmentation k-medoide en C está disponible en el C Clustering Library (source, Manual). (Nótese que Cluster 3.0 es una extensión de esta biblioteca, y puede no proporcionar k-medoids)

    Del manual:

    En la Biblioteca C Clustering, tres algoritmos de partición están disponibles: • K-means clustering • k-medianas agrupar • k-medoids agrupación

  2. k-medoids in mlpy, Machine Learning library in Python

  3. k-medoids in Matlab

  4. k-medoids in Java

  5. k-medoids in C++

+1

Gracias por su respuesta. Como sé, k-medians es diferente de k-medoids. Además, la herramienta Cluster 3.0 no devuelve los centroides como puntos de datos originales. Si estoy equivocado, por favor corrígeme. Acerca de otros programas y códigos, son agradables. Sin embargo, dado que están escritos por personas individuales, no por laboratorios como GenePattern o Cluster3.0, me preocupa un poco la limitación de ellos. De todos modos, si no hay otra solución, intentaré usar software de individuos. – Cassie

+0

@Cassie, The C Clustering Library es una precuela de Cluster 3.0 y lo proporcionan los mismos autores en esa misma página. * k-medoids * (y k-medianas) se proporciona allí. Además, * mlpy * no está escrito por un individuo. – cyborg

+0

El conjunto de bibliotecas R proporciona k-medias y k-medoides. – Riccardo

2

software:

  • ELKI incluye varias variantes de k-medias, incluidos K-medoids y PAM.
  • GNU R incluye en las variantes del paquete "flexclust" de k-means y en el paquete "cluster".
  • Gap Una biblioteca de fuente abierta embrional en clústeres basados ​​en distancia.

Fuente: http://en.wikipedia.org/wiki/K-medoids

Cuestiones relacionadas