Wow, por lo que tiene algunos datos de entrenamiento y no sabe si está mirando las funciones que representan palabras en un documento, o genese en una celda y necesita ajustar un clasificador. Bueno, ya que no tiene ninguna información semántica, tendrá que hacer esto solo mirando las propiedades estadísticas de los conjuntos de datos.
Primero, para formular el problema, esto es más que lineal versus no lineal. Si realmente está buscando clasificar estos datos, lo que realmente necesita hacer es seleccionar una función del núcleo para el clasificador que puede ser lineal o no lineal (gaussiana, polinómica, hiperbólica, etc. Además, cada función del núcleo puede tomar uno o más parámetros que tendrían que establecerse. Determinar una función óptima del kernel y un conjunto de parámetros para un problema de clasificación dado no es realmente un problema resuelto, solo hay heurísticas útiles y si googleas 'seleccionando una función kernel' o 'elegir kernel' función ', se le tratará con muchos artículos de investigación que proponen y prueban varios enfoques. Si bien hay muchos enfoques, uno de los más básicos y bien recorridos es hacer un descenso de gradiente en los parámetros, básicamente se prueba un método de kernel y un juego de parámetros, entrena en la mitad de tus puntos de datos y observa cómo lo haces. Luego, prueba con un conjunto diferente de parámetros y observa cómo lo haces. Mueves los parámetros en la dirección de mejoría de precisión hasta que obtienes satisfacción resultados de tory.
Si no necesita pasar por toda esta complejidad para encontrar una buena función de núcleo, y simplemente quiere una respuesta lineal o no lineal. entonces la pregunta se reduce principalmente a dos cosas: Los clasificadores no lineales tendrán un mayor riesgo de sobreajuste (generalización insuficiente) ya que tienen más dimensiones de libertad. Pueden sufrir del clasificador simplemente memorizando conjuntos de buenos puntos de datos, en lugar de tener una buena generalización. Por otro lado, un clasificador lineal tiene menos libertad para ajustarse, y en el caso de datos que no son separables linealmente, no podrá encontrar una buena función de decisión y sufrirá altas tasas de error.
Desafortunadamente, no conozco una mejor solución matemática para responder a la pregunta "¿Es esta información linealmente separable?", Aparte de probar el clasificador y ver cómo funciona. Para eso, vas a necesitar una respuesta más inteligente que la mía.
Editar: Este artículo de investigación describe un algoritmo que parece que debería ser capaz de determinar qué tan cerca de un conjunto de datos dado se puede separar de forma lineal.
http://www2.ift.ulaval.ca/~mmarchand/publications/wcnn93aa.pdf
[a quien haya comenzado a cerrar esta publicación]: Esta _es_ programación relacionada! – mjv
@mjv: ¿Qué quieres decir? –
Sin preocupaciones; Los usuarios con mayor reputación pueden ver el recuento de votos para cerrar la pregunta, y anoté un voto, con la razón "NPR" (No relacionado con el programa). Mi comentario fue en apoyo de la pregunta, indicando que aunque suena algo teórico y matemático, esta pregunta fue muy relevante para la programación. La pregunta parece segura, no ha habido otros votos para el cierre (se requieren 5). – mjv