Estoy buscando una guía experta aquí sobre cuál es el mejor enfoque para mí para resolver un problema. Investigué algo de aprendizaje automático, redes neuronales y cosas así. Investigué Weka, una especie de solución baiana ... R ... varias cosas diferentes. Aunque no estoy seguro de cómo proceder realmente. Aquí está mi problema.El mejor enfoque para lo que creo que es un problema de aprendizaje automático
Tengo, o tendré, una gran colección de eventos ... eventualmente alrededor de 100,000 o más. Cada evento consta de varias (30-50) variables independientes, y 1 variable dependiente que me importa. Algunas variables independientes son más importantes que otras para determinar el valor de la variable dependiente. Y, estos eventos son relevantes para el tiempo. Las cosas que ocurren hoy son más importantes que los eventos que ocurrieron hace 10 años.
Me gustaría ser capaz de alimentar algún tipo de motor de aprendizaje de un evento, y hacer que prediga la variable dependiente. Luego, conociendo la respuesta real para la variable dependiente para este evento (y todos los eventos que han surgido antes), me gustaría que esto admita las conjeturas posteriores.
Una vez que tenga una idea de la dirección de programación a seguir, puedo hacer la investigación y descubrir cómo convertir mi idea en código. Pero mi experiencia es la programación paralela y no cosas como esta, así que me gustaría tener algunas sugerencias y orientación sobre esto.
Gracias!
Editar: Aquí hay un poco más de detalle sobre el problema que estoy tratando de resolver: Es un problema de precios. Digamos que estoy queriendo predecir precios para un cómic al azar. El precio es lo único que me importa. Pero hay muchas variables independientes que uno podría pensar. Es un comic de Superman o un comic de Hello Kitty. ¿Qué edad tiene? ¿Cuál es la condición? etc. Después de entrenar por un tiempo, quiero poder darle información sobre un cómic que podría estar considerando, y que me dé un valor razonablemente esperado para el cómic. DE ACUERDO. Así que los comics pueden ser un ejemplo falso. Pero entiendes la idea general. Hasta el momento, de las respuestas, estoy investigando en máquinas de vectores de soporte y Naive Bayes. Gracias por toda su ayuda hasta ahora.
Creo que la etiqueta "clasificación" y "regresión" es mutuamente excluyente. Es "clasificación", o es "regresión". No puede ser ambos. –