Estoy tratando de realizar la selección de atributos en Weka. Me gustaría usar InfoGainAttributeEval como evaluador, porque leo que es equivalente a información mutua, y Ranker como método de búsqueda. ¿Debo realizar la selección de atributos tanto para el entrenamiento como para el conjunto de pruebas? Además, ¿cómo puedo elegir el valor correcto para el parámetro N?Weka Atributo Selección
Muchas gracias por su tiempo,
Nadia
Hola @Sicco! Supongo que el filtrado por lotes es equivalente a su método para compatibilizar el entrenamiento y el conjunto de pruebas. Sus sugerencias sobre los parámetros -N y -T me ayudaron a aclarar el problema y estoy a punto de probarlo en Weka. ¡Muchas gracias por la información y disculpe por la respuesta tardía! ¿ – nadia
no elegirá los atributos de esta manera sobreajustar? – fiacobelli
@fiacobelli Depende de qué tan estricto establezca el umbral. Si solo tomas el atributo de mejor rendimiento e ignoras el resto, es más probable que el ajuste excesivo sea más probable. Mi consejo fue tomar tantos atributos que parecen contener algunos datos interesantes y eliminar los atributos que claramente carecen de información valiosa. Hice esto más claro en mi respuesta. – Sicco