Estoy tratando de crear mi propio y simple algoritmo de selección de funciones. El conjunto de datos con el que voy a trabajar es here (conjunto de datos muy famoso). ¿Alguien puede darme un puntero sobre cómo hacerlo?Algoritmo de selección de características más simple
Estoy planeando escribir un algoritmo de rango de características para una clasificación de texto. Esto es para un análisis del sentimiento de las reseñas de películas, clasificándolas como positivas o negativas.
Así que mi pregunta es sobre cómo escribir una selección de funciones simples para un conjunto de datos de texto.
Ese es un gran tema. ¿Hay algo específico con lo que tenga problemas o necesita ideas de dónde empezar? –
Solo quiero eliminar las características que agregan ruido a la clasificación. Pero, ¿cómo elijo este tipo de palabras sistemáticamente? ¿Cuál es el número apropiado de características que me da la mejor precisión y qué palabras ... Supongo que eso es lo que quiero que mi resultado final del algoritmo sea – aherlambang