No estoy seguro de que la clasificación necesariamente haga una declaración sobre las poblaciones de las que se extraen los puntos de datos. La clasificación, como probablemente sepa, utiliza datos de entrenamiento que consisten en algunos vectores de "características", cada uno etiquetado con una clase específica, para predecir las etiquetas de clase que pertenecen a otros vectores de características sin etiquetar. Por ejemplo, podríamos usar los signos vitales de un paciente y el diagnóstico de un médico para predecir si otros pacientes están sanos o enfermos.
Algunos clasificadores, llamados "clasificadores generativos", intentan modelar explícitamente las poblaciones o el proceso de generación de datos que produce cada clase. Por ejemplo, el algoritmo Naive Bayes calculaPAGS( clase = c | características ) para cada clase do, suponiendo que las características sean todas independientes. Estos modelos podrían verse razonablemente como declaraciones sobre la población.
Sin embargo, otros clasificadores buscan diferencias entre las clases sin modelar las clases mismas; Estos se llaman clasificadores discriminativos. Un ejemplo clásico es el clasificador vecino más cercano, que asigna un ejemplo sin etiquetar a la clase de su vecino más cercano (donde cerrar se define de alguna manera sensata para el problema). No parece que contenga mucha información, si es que hay alguna, sobre las poblaciones de las que se extrajeron los puntos de datos.
Si está interesado en la diferencia entre estadística descriptiva e inferencial, podría ser más fructífero pensar en el propósito del análisis. Una estadística descriptiva, como la media, podría decirle cuántas truchas hay en un lago típico: describen algo. Una estadística inferencial, como unt-test, podría decirle si generalmente hay más truchas que bajos en estos lagos-- le permite hacer una afirmación sobre una estadística descriptiva.