¿Qué algoritmos útiles existen que funcionan en grandes flujos de datos y también sus resultados son bastante pequeños y uno puede calcular el resultado para una mezcla de dos flujos fusionando de alguna manera sus resultados?
Puedo nombrar algunos:
- Las cosas obvias como sum, min, max, count, top-K, etc.
- Aproximadamente los llamados algoritmos de flujo "basados en bocetos" para histogramas, contando elementos distintos o cuantiles informáticos
¿Qué otros hay?
(Estoy interesado porque estoy escribiendo un proyecto de pasatiempo para monitorear sistemas distribuidos cuya utilidad está directamente determinada por la utilidad de tales algoritmos)