16

everyone. Soy completamente nuevo en el tema de los algoritmos de clasificación, y necesito algunos consejos sobre dónde comenzar una "lectura seria". Estoy en este momento en el proceso de averiguar si el aprendizaje automático y los algoritmos de clasificación automatizados podrían ser algo valioso para agregar a alguna aplicación mía.Recursos para principiantes/introducciones a los algoritmos de clasificación

que ya escaneadas a través "cómo resolverlo: la heurística modernos" por Z. Michalewicz y D. Fogel (en particular, los capítulos sobre los clasificadores lineales usando redes neuronales), y en el aspecto práctico, actualmente estoy mirando a través del código fuente WEKA toolkit. Mi próximo paso (planeado) sería sumergirme en el reino de los algoritmos de clasificación bayesianos.

Lamentablemente, carezco de una base teórica seria en esta área (y mucho menos, de haberlo usado de alguna manera hasta el momento), por lo que cualquier indicio de dónde mirar a continuación sería apreciado; en particular, sería útil una buena introducción a los algoritmos de clasificación disponibles. Siendo más un artesano y menos un teórico, más práctico, mejor ...

Consejos, ¿alguien?

Respuesta

9

Siempre he encontrado Andrew Moore's Tutorials para ser muy útil. Se basan en una sólida teoría estadística y serán muy útiles para entender documentos si elige leerlos en el futuro. He aquí una breve descripción:

Estos incluyen la clasificación algoritmos tales como árboles de decisión, redes neuronales, clasificadores bayesianos, Support Vector Machines y a base de entubado (también conocido como no paramétricos) aprendizaje. Incluyen los algoritmos de regresión tales como la regresión multinomial polinomial, MARS, localmente Regresión ponderada, GMDH y las redes neurales . Y que incluyen otros datos operaciones mineras tales como la agrupación (modelos de mezcla, k-medias y jerárquica), redes bayesianas y aprendizaje por refuerzo

+0

Gracias. Esto era más o menos lo que estaba buscando. – Dirk

4

Visión general de la máquina de aprendizaje

Para conseguir un buen descripción general del campo, mire las videoconferencias de Andrew Ng's Machine Learning course.

Este curso (CS229) - impartido por el profesor Andrew Ng - ofrece una amplia introducción al aprendizaje automático y reconocimiento de patrones estadísticos. Los temas incluyen el aprendizaje supervisado, el aprendizaje no supervisado, la teoría del aprendizaje, el aprendizaje reforzado y el control adaptativo. También se discuten las aplicaciones recientes de aprendizaje automático, como el control robótico, la minería de datos, la navegación autónoma, la bioinformática, el reconocimiento de voz y el procesamiento de datos de texto y web.

clasificadores

En cuanto a qué clasificador que debe utilizar, lo recomiendo primero empezando por Support Vector Machines (SVM) para tareas generales de clasificación aplicados. Le darán un rendimiento de vanguardia, y no es necesario que entienda toda la teoría detrás de ellos para utilizar la implementación proporcionada por un paquete como WEKA.

Si tiene un conjunto de datos más grande, puede intentar usar Random Forests. También hay an implementation de este algoritmo en WEKA, y entrenan mucho más rápido en datos de gran tamaño. Aunque se utilizan menos ampliamente que las SVM, su precisión tiende a coincidir o casi coincidir con la precisión que se puede obtener de una.

+0

Gracias. Una introducción muy fácil de leer para principiantes como yo a SVN parece ser http://www.tristanfletcher.co.uk/SVM%20Explained.pdf – Dirk

6

El answer referring to Andrew Moore's tutorials is a good one. Me gustaría aumentarlo, sin embargo, sugiriendo algunas lecturas sobre la necesidad que impulsa la creación de muchos sistemas de clasificación en primer lugar: identificación de relaciones causales. Esto es relevante para muchos problemas de modelado que implican inferencia estadística.

El mejor recurso actual que conozco para aprender sobre la causalidad y los sistemas clasificadores (especialmente los clasificadores bayesianos) es Judea Pearl's book "Causality: models, reasoning, and inference".

Cuestiones relacionadas