Algoritmos de modelo de consulta estadística?


13

Hice esta pregunta en preguntas y respuestas validadas cruzadas, pero parece que está relacionada con CS mucho más que las estadísticas.

¿Me puede dar ejemplos de algoritmos de aprendizaje automático que aprendan de las propiedades estadísticas del conjunto de datos, no de las observaciones individuales, es decir, empleen el modelo de consulta estadística ?


1
¿Cuál es el modelo de consulta estadística?
Suresh Venkat

del documento de Kearns portal.acm.org/citation.cfm?doid=293347.293351 : "en este modelo, un algoritmo de aprendizaje tiene prohibido examinar ejemplos individuales de la función objetivo desconocida, pero se le da acceso a un oráculo que proporciona estimaciones de probabilidades sobre la muestra espacio de ejemplos aleatorios ". lo siento si no es obvio, he actualizado mi pregunta con el enlace al documento
Deyaa

Respuestas:


14

Casi todos los algoritmos que funcionan en el modelo PAC (con la excepción de los algoritmos de aprendizaje de paridad) pueden funcionar en el modelo SQ. Ver, por ejemplo, este artículo de Blum et al. en el que varios algoritmos populares se traducen en sus equivalentes SQ ( Privacidad práctica: el marco de trabajo SuLQ ). El documento se refiere en principio a la "privacidad", pero puede ignorarlo: en realidad solo se trata de implementar algoritmos con consultas SQ.

El aprendizaje agnóstico, por otro lado, es mucho más difícil en el modelo SQ: aparte de los problemas computacionales (aunque estos son importantes), la complejidad de la muestra requerida para el aprendizaje agnóstico es aproximadamente la misma que la requerida para el aprendizaje exacto, si realmente tiene acceso a Los puntos de datos. Por otro lado, el aprendizaje agnóstico se vuelve mucho más difícil en el modelo SQ: por lo general, deberá realizar muchas consultas superpolinomialmente, incluso para clases tan simples como disyunciones monótonas. Consulte este documento de Feldman ( Una caracterización completa del aprendizaje de consultas estadísticas con aplicaciones a la capacidad de evolución ) o este documento reciente de Gupta et al. ( Conjunciones de publicación privada y la barrera de consulta estadística )


muy buena respuesta Aaron :) muchas gracias :)
Deyaa

7

El modelo SQ se realizó para analizar el aprendizaje tolerante al ruido, es decir, un algoritmo que funciona realizando consultas estadísticas funcionará bajo el ruido de clasificación. Como dijo Aaron, la mayoría de los algoritmos PAC que tenemos tienen equivalentes en el modelo SQ. La única excepción es la eliminación gaussiana, que se usa para aprender paridades (incluso se puede usar una aplicación inteligente de la misma).para aprender las paridades de tamaño log (n) loglog (n) en el modelo de clasificación de ruido). También sabemos que las paridades no se pueden aprender con consultas estadísticas, y resulta que las clases más interesantes, como los árboles de decisión, pueden simular funciones de paridad. Entonces, en nuestra búsqueda para obtener algoritmos de aprendizaje PAC para muchas clases interesantes (como árboles de decisión, DNF, etc.), sabemos que necesitamos algoritmos de aprendizaje fundamentalmente nuevos que no funcionan en el modelo de consulta estadística.


Interesante. ¿Tiene alguna referencia de que las paridades no se pueden aprender en el modelo SQ?
M. Alaggan el

1
Kearns lo probó en su artículo original que define el modelo: portal.acm.org/citation.cfm?doid=293347.293351 y luego Blum et al lo mostraron nuevamente donde definieron la dimensión SQ de una clase portal.acm.org/citation .cfm? id = 195058.195147 . Básicamente, el argumento es el siguiente: las paridades son "independientes en pares" con la distribución uniforme, por lo que tienes que adivinar la paridad correcta para aprender algo, y hay muchas paridades posibles ...
Lev Reyzin

5

Me gustaría aclarar un poco la respuesta de Aaron. Casi todos los algoritmos agnósticos (una vez más, excepto cualquier cosa que use la eliminación gaussiana) pueden funcionar en el modelo SQ. Naturalmente, el aprendizaje agnóstico es más difícil que el aprendizaje no agnóstico, pero esta es una pregunta independiente.


/ /ϵ2
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.