2012-06-04 40 views
6

¿Qué queremos decir cuando decimos que estamos evaluando los clusters en WEKA frmework? La agrupación es un enfoque no supervisado para agrupar objetos. ¿Qué queremos decir cuando decimos que queremos evaluar el resultado? Además, además de esto, cuando decimos que estamos evaluando los clusters además de los datos de entrenamiento en sí, ¿qué significa eso?¿Qué es la evaluación de un clúster en WEKA?

Gracias Abhishek S

+1

Weka es bastante inexistente en lo que respecta a la agrupación. Si está interesado en la agrupación (que es un poco más complicado que la clasificación), busque alternativas. Algunos consejos sobre la evaluación: el recuento de pares de la medida f, índice de Rand ajustado (ARI), índice de Fowlkes-Mallows, índice de Jaccard, medidas de BCubed, etc. -No creo que Weka tenga ninguno de estos. –

Respuesta

9

como está escrito en la página this:

Evaluación La forma Weka evalúa los agrupamientos depende del modo de clúster que seleccione. Hay cuatro modos de clúster diferentes disponibles (como botones en el panel del modo Cluster):

  1. Use training set (predeterminado). Después de generar el agrupamiento, Weka clasifica las instancias de capacitación en clusters de acuerdo con la representación del clúster y calcula el porcentaje de instancias que caen en cada clúster. Por ejemplo, la agrupación anterior producida por k-means muestra 43% (6 instancias) en el clúster 0 y 57% (8 instancias) en el clúster 1.
  2. En Supplied test set o Percentage split Weka puede evaluar clusters en datos de prueba separados si el clúster la representación es probabilística (por ejemplo, para EM).
  3. Classes to clusters evaluation. En este modo, Weka primero ignora el atributo de clase y genera el agrupamiento. Luego, durante la fase de prueba, asigna clases a los clusters, en función del valor de la mayoría del atributo de clase dentro de cada clúster. Luego calcula el error de clasificación, basado en esta asignación y también muestra la matriz de confusión correspondiente. Un ejemplo de esto para k-means se muestra a continuación.
+0

Gracias por la referencia y la respuesta elaborativa. –

+0

¿Alguna idea de cómo funciona la evaluación de clases a clusters para EM? ¿Pondera las instancias por su probabilidad de estar en el clúster al determinar el valor de la mayoría? – kylejmcintyre

+0

sicco puede consultar esta pregunta si es posible: http: //stackoverflow.com/questions/32404742/how-to-calculate-clustering-success-pre-assigment-true-classes-are-known – MonsterMMORPG

Cuestiones relacionadas