Python es un montón de bibliotecas ML (como el gran scikit-learn). ¿Hay algo bueno para Java / Scala, que contiene muchos algos (regresión, clasificación, agrupación, validación cruzada, procesamiento de características), estable y mantenido y capaz de manejar un conjunto de datos masivo?
Acabo de encontrar a Mahout, Breeze / Nak y Weka, pero no se ven tan bien como los de Python.
Además, si no hay un equivalente, ¿cómo puedo conectar eficientemente el código Java con Python?