Soy nuevo en el aprendizaje automático y trato de usar scikit-learn (sklearn) para tratar un problema de clasificación. Tanto DecisionTree como SVM pueden entrenar a un clasificador para este problema.
Utilizo sklearn.ensemble.RandomForestClassifier
y sklearn.svm.SVC
para ajustar los mismos datos de entrenamiento (alrededor de 500,000 entradas con 50 funciones por entrada). El RandomForestClassifier sale con un clasificador en aproximadamente un minuto. El SVC usa más de 24 horas y sigue funcionando.
¿Por qué el SVC funciona tan ineficientemente? ¿El conjunto de datos es demasiado grande para SVC ? ¿ SVC es inadecuado para tal problema?