Biblioteca completa de aprendizaje automático para Java / Scala [cerrado]


8

Python es un montón de bibliotecas ML (como el gran scikit-learn). ¿Hay algo bueno para Java / Scala, que contiene muchos algos (regresión, clasificación, agrupación, validación cruzada, procesamiento de características), estable y mantenido y capaz de manejar un conjunto de datos masivo?

Acabo de encontrar a Mahout, Breeze / Nak y Weka, pero no se ven tan bien como los de Python.

Además, si no hay un equivalente, ¿cómo puedo conectar eficientemente el código Java con Python?


Quizás considere agregar un pequeño detalle sobre lo que hace que scikit-learn sea excelente en comparación con Mahout & c.
Scortchi - Restablece a Monica

Gran cantidad de algoritmos para clasificación, regresión, selección de características, reducción de características, etc. Además, tiene una gran comunidad de contribuyentes y apoyo
boskaiolo

¿Podría ser un poco más específico sobre lo que está tratando de lograr? Una forma común de "conectar" Java y Python es usar jython, jython.org .
sandris

Echa un vistazo a mloss.org
Marc Claesen

Respuestas:



5

Apache Spark y específicamente su componente MLlib se ve exactamente como lo que estás buscando. MLlib contiene implementaciones para clasificación, regresión, reducción de dimensionalidad, etc. Puede programar en Scala, Java y Python.

Básicamente es un marco informático distribuido muy rápido que se puede ejecutar en un clúster Hadoop. Para fines de desarrollo, también puede ejecutarlo fácilmente en modo independiente (sin Hadoop) en su máquina local.

Consulte la guía MLlib aquí: https://spark.apache.org/docs/latest/mllib-guide.html


1

Eche un vistazo a JavaML ( http://java-ml.sourceforge.net/ ) y Encog ( http://www.heatonresearch.com/encog ). Este último se centra más en redes neuronales que en muchos algoritmos.

Además, es posible que weka no tenga una API de Java muy amigable (porque, en primer lugar, es una aplicación GUI, no una biblioteca), pero cuando te acostumbras, comienzas a apreciar cuántas cosas se implementan allí.

Los he usado con éxito todos.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.