Edición final con todos los recursos actualizados:
Para un proyecto, estoy aplicando algoritmos de aprendizaje automático para la clasificación.
Reto: datos etiquetados bastante limitados y muchos más datos sin etiquetar.
Metas:
- Aplicar clasificación semi-supervisada
- Aplicar un proceso de etiquetado semi-supervisado de alguna manera (conocido como aprendizaje activo)
He encontrado mucha información de trabajos de investigación, como la aplicación de EM, SVM transductivo o S3VM (SVM semi supervisado), o de alguna manera usando LDA, etc. Incluso hay pocos libros sobre este tema.
Pregunta: ¿Dónde están las implementaciones y las fuentes prácticas?
Actualización final (basada en las ayudas proporcionadas por mpiktas, bayer y Dikran Marsupial)
Aprendizaje semi-supervisado:
- TSVM: en SVMligth y SVMlin .
- EM ingenuo Bayes en Python
- EM en proyecto LinePipe
Aprendizaje activo:
- Dualist : una implementación de aprendizaje activo con código fuente en clasificación de texto
- Esta página web ofrece una maravillosa descripción del aprendizaje activo.
- Un taller de diseño experimental: aquí .
Aprendizaje profundo:
- Video introductorio aquí .
- Sitio general .
- Tutorial de aprendizaje de características y aprendizaje profundo sin supervisión de Stanford .