14

Me parece que aprender nuevos temas es lo mejor con una implementación fácil de codificar para obtener la idea. Así es como aprendí los algoritmos genéticos y la programación genética. ¿Cuáles serían algunos buenos programas de introducción para escribir para comenzar con el aprendizaje automático?¿Cuál es una buena primera implementación para aprender a aprender máquinas?

Preferiblemente, vamos a cualquier recurso de referencia sean accesibles en línea por lo que la comunidad puede beneficiarse

+0

¿Y cuál fue la primera implementación fácil para aprender algoritmos genéticos en general? – zubinmehta

+1

Tome el curso de ML en coursera.org. – ziggystar

Respuesta

4

Creo que se puede escribir un clasificador "Naive Bayes" para el filtrado de correo basura. Puede obtener mucha información de este libro.

http://nlp.stanford.edu/IR-book/information-retrieval-book.html

+1

Aquí hay otro gran libro gratis: Los Elementos del Aprendizaje Estadístico - www-stat.stanford.edu/~hastie/Papers/ESLII.pdf – tathagata

+0

El EoSL es algo difícil, en mi opinión. No es adecuado como lectura inicial, su nivel es para estudiantes de posgrado. – lmsasu

+0

Sí, también estoy de acuerdo con Imsasu. Pero el libro "Una Introducción a la Recuperación de Información" no es tan difícil de leer. –

1

árbol de decisión. Se usa con frecuencia en tareas de clasificación y tiene muchas variantes. El libro de Tom Mitchell es una buena referencia para implementarlo.

-9

Hay algo llamado libros; ¿estás familiarizado con eso? Cuando exploraba AI hace dos décadas, había muchos libros. Supongo que ahora que existe Internet, los libros son arcaicos, pero probablemente puedas encontrarlos en una biblioteca antigua.

+0

Lamento que la gente piense que los libros no son buenos, pero hay abundantes recursos disponibles en los libros. Los libros serían mucho más útiles que las otras respuestas aquí. –

+2

Supongo que no puede leer las otras respuestas que hacen referencia a buenos libros ... – Malcolm

12

¿En qué idioma (s) se desarrollará (n)? Si eres flexible, recomiendo a Matlab, python y R como buenos candidatos. Estos son algunos de los lenguajes más comunes utilizados para desarrollar y evaluar algoritmos. Facilitan el desarrollo y la evaluación rápida de algoritmos, manipulación y visualización de datos. La mayoría de los algoritmos ML populares también están disponibles como bibliotecas (con fuente).

Comenzaré centrándome en la clasificación básica y/o ejercicios de agrupamiento en R2. Es más fácil de visualizar, y generalmente es suficiente para explorar problemas en ML, como riesgo, desequilibrio de clase, etiquetas ruidosas, capacitación en línea vs. fuera de línea, etc. Cree un conjunto de datos de la vida cotidiana, o un problema que le interese. O use un clásico, como el conjunto de datos Iris, para que pueda comparar su progreso con la literatura publicada. Puede encontrar el conjunto de datos del iris en:

Uno de sus buenas características es que tiene una clase, 'setosa', que es fácilmente separables linealmente desde los demás.

Una vez que elija un par de conjuntos de datos interesantes, comience implementando algunos clasificadores estándar y examinando su rendimiento. Esta es una buena lista corta de los clasificadores para aprender:

  • k-vecinos más cercanos
  • análisis discriminante lineal
  • árboles de decisión (por ejemplo, C4.5)
  • máquinas de vectores de soporte (por ejemplo, a través de LibSVM)
  • impulsar (con tocones)
  • clasificador bayesiano

Wi En el conjunto de datos Iris y en uno de los idiomas que menciono, puede hacer fácilmente un mini-estudio usando cualquiera de los clasificadores rápidamente (de minutos a horas, dependiendo de su velocidad).

Editar: Puede buscar en google "Clasificación de datos del iris" para encontrar muchos ejemplos.Aquí es un documento de demostración clasificación por Mathworks usando conjunto de datos Iris:

http://www.mathworks.com/products/statistics/demos.html?file=/products/demos/shipping/stats/classdemo.html

1

redes neuronales pueden ser la cosa más fácil de aplicar en primer lugar, y que están bastante bien cubierto en toda la literatura.

+0

Este sería un buen recurso para eso: http://neuralnetworksanddeeplearning.com/ – marbel

Cuestiones relacionadas