estoy trabajando en un proyecto y tengo un subconjunto de datos de tiempos de pulsaciones de teclas del usuario. Esto significa que el usuario hace n intentos y utilizaré estos datos de tiempo de intentos grabados en varios tipos de algoritmos de clasificación para futuros intentos del usuario para Verifique que el proceso de inicio de sesión lo realice el usuario o alguna otra persona. (Simplemente puedo decir que esto es biométrico)¿Cuál es la mejor manera de generar datos falsos para un problema de clasificación?
Tengo 3 diferentes momentos del proceso de intento de inicio de sesión de usuario, por supuesto, esto es un subconjunto de los datos infinitos.
hasta ahora es un problema de clasificación fácil, decidí usar WEKA pero hasta donde tengo entendido, tengo que crear algunos datos falsos para alimentar el algoritmo de clasificación. Los intentos medidos del usuario serán 1 y los datos falsos serán 0
¿Puedo usar algunos algoritmos de optimización? o hay alguna forma de crear estos datos falsos para obtener un mínimo de falsos positivos?
Gracias
gracias por la respuesta Daniel.Después de entender sus puntos, voy a publicar aquí para obtener ayuda. – berkay
Claro, hágamelo saber si hay algo que deba ser elaborado. Si encuentra esta respuesta u otras que sean útiles o informativas, asegúrese de votarlas y seleccionar una como respuesta aceptada a la pregunta. – dmcer