Google está utilizando diferentes técnicas de aprendizaje automático y algoritmos para el entrenamiento y la predicción. Las estrategias para el aprendizaje supervisado a gran escala: 1. Submuestra 2. Paralelamente vergonzosamente algunos algoritmos 3. Descenso de gradiente distribuido 4. Voto mayoritario 5. Mezcla de parámetros 6. Mezcla de parámetros iterativos
Deben entrenar y predecir el modelo con las diferentes técnicas de aprendizaje automático y usar un algoritmo para decidir el mejor modelo y predicción para el retorno.
- El submuestreo proporciona un rendimiento inferior
- La mezcla de parámetros mejora, pero no es tan buena como todos los datos.
- Los algoritmos distribuidos devuelven mejores clasificadores más rápido
- La mezcla de parámetros iterativos logra tan buena como todos los datos
Pero, por supuesto, no está realmente claro en la documentación de la API.