Plataformas de computación en la nube para aprendizaje automático [cerrado]


Respuestas:


15

No he usado estas empresas, pero estas son solo algunas de las opciones. Sin embargo, configurar EC2 es muy simple. Al menos después de haber adormecido la cabeza golpeándola contra la pared con la suficiente fuerza y ​​frecuencia. También aumenta su umbral de dolor. Los niños en estos días lo tienen mucho más fácil. Cuando comencé, estábamos haciendo cómputo de niebla: no teníamos lo más confuso de lo que estábamos computando.

Dejando de lado las reminiscencias ... Existen herramientas y recursos para eludir a estos proveedores y comenzar por su cuenta. JD Long, consegue , ha hecho que sea más fácil comenzar a usar R en EMR.

Con respecto a Python, boto es una suite que permite que Python se ponga en funcionamiento fácilmente en EC2. También es bastante fácil poner Python en funcionamiento en AppEngine de Google , si está dispuesto a considerar una alternativa EC2. Si conoce Python, entonces no hay necesidad de contratar a una empresa para que realice el levantamiento por usted, a menos que no esté familiarizado con el escalado, el fragmentación, el equilibrio de carga, etc., incluso a nivel conceptual. Por otro lado, si está considerando gastar mucho dinero en dichos servicios, es una buena idea familiarizarse con la forma de hacer que su código sea eficiente.

En cuanto a Octave en la nube, no tengo idea de lo que existe aparte de estas tres compañías. Monkey Analytics solía ofrecerlo, pero parece que se han ido. Recomendaría evitar Octave y enfocarme en Python o R.

Un recurso para facilitar la configuración es StarCluster . Nuevamente, no hay experiencia con ellos, pero esa puede ser una ruta útil.

Honestamente, Ubuntu (o Windows) y EC2 no son tan difíciles de aprender. Realmente no recomendaría Windows para R, ya que no hay mucho amor entre los desarrolladores de R y Windows. (Nota: por lo que puedo decir, no hay servicios serios en la nube de Mac OS X). Una vez que tienes un escritorio remoto, estás en el negocio. Aprender a escalar es el siguiente paso.


Actualización 1: Otros servicios de administración en la nube más generales incluyen RighstScale y Scalr.

Actualización 2: Quiero enfatizar que aprender a configurar sus instancias y clústeres en la nube es importante. Entre los beneficios del trabajo práctico:

  • Aprenda a administrar una combinación de recursos (múltiples instancias, múltiples tipos de instancias, muchos HD, diferentes zonas o regiones de disponibilidad, varias herramientas de monitoreo y más)
  • Juegue con GPU si lo desea (consulte gputools)
  • Puede actualizar o revertir más fácilmente su selección de paquetes
  • Es posible que pueda obtener costos mucho más bajos utilizando instancias puntuales o instancias reservadas.
  • Puede probar diferentes GUI o IDE de R, que podrían no ser una opción para los proveedores de la nube.

Hay beneficios al usar un proveedor administrado, como una curva de aprendizaje más corta, posiblemente un mejor soporte para compartir recursos entre un grupo y quizás algunos buenos artilugios, pero no puedo hablar de los beneficios cuando comencé a usar EC2 antes de cualquiera de estos Llegó al mercado.


5

También hay PiCloud para ejecutar código Python en paralelo en EC2.

Desde su página de producto :

PiCloud es una plataforma de computación en la nube que se integra en el lenguaje de programación Python. Le permite aprovechar la potencia informática de Amazon Web Services sin tener que administrar, mantener o configurar servidores virtuales.

PiCloud se integra perfectamente en su base de código existente a través de una biblioteca Python personalizada, en la nube. Para descargar la ejecución de una función a nuestros servidores, todo lo que debe hacer es pasar la función deseada a la biblioteca en la nube. PiCloud ejecutará la función en su clúster de alto rendimiento. A medida que ejecuta más funciones, nuestro clúster se escala automáticamente para satisfacer sus necesidades computacionales. ¡Subirse a la nube nunca ha sido tan fácil!


Soy bastante aficionado a PiCloud: los he encontrado extraordinariamente fáciles de poner en funcionamiento.
Fomite

3

¿Intentaste CloudStat antes? A diferencia de otras nubes, CloudStat está destinado solo para usuarios de R Language. No hay más configuraciones. solo puede iniciar sesión y usar hasta 7.5 Gb de RAM de forma gratuita.

Sin embargo, con una cuenta gratuita, su análisis será visto y utilizado por el público. La opción es pagar $ 5 por mes para que su análisis sea privado.


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.