Tengo una pequeña lista de compañías que proporcionan una plataforma para ejecutar scripts de R, python u octava en clústeres creados sobre Amazon EC2. ¿Hay otros nombres que debo agregar?
Tengo una pequeña lista de compañías que proporcionan una plataforma para ejecutar scripts de R, python u octava en clústeres creados sobre Amazon EC2. ¿Hay otros nombres que debo agregar?
Respuestas:
No he usado estas empresas, pero estas son solo algunas de las opciones. Sin embargo, configurar EC2 es muy simple. Al menos después de haber adormecido la cabeza golpeándola contra la pared con la suficiente fuerza y frecuencia. También aumenta su umbral de dolor. Los niños en estos días lo tienen mucho más fácil. Cuando comencé, estábamos haciendo cómputo de niebla: no teníamos lo más confuso de lo que estábamos computando.
Dejando de lado las reminiscencias ... Existen herramientas y recursos para eludir a estos proveedores y comenzar por su cuenta. JD Long, consegue
, ha hecho que sea más fácil comenzar a usar R en EMR.
Con respecto a Python, boto es una suite que permite que Python se ponga en funcionamiento fácilmente en EC2. También es bastante fácil poner Python en funcionamiento en AppEngine de Google , si está dispuesto a considerar una alternativa EC2. Si conoce Python, entonces no hay necesidad de contratar a una empresa para que realice el levantamiento por usted, a menos que no esté familiarizado con el escalado, el fragmentación, el equilibrio de carga, etc., incluso a nivel conceptual. Por otro lado, si está considerando gastar mucho dinero en dichos servicios, es una buena idea familiarizarse con la forma de hacer que su código sea eficiente.
En cuanto a Octave en la nube, no tengo idea de lo que existe aparte de estas tres compañías. Monkey Analytics solía ofrecerlo, pero parece que se han ido. Recomendaría evitar Octave y enfocarme en Python o R.
Un recurso para facilitar la configuración es StarCluster . Nuevamente, no hay experiencia con ellos, pero esa puede ser una ruta útil.
Honestamente, Ubuntu (o Windows) y EC2 no son tan difíciles de aprender. Realmente no recomendaría Windows para R, ya que no hay mucho amor entre los desarrolladores de R y Windows. (Nota: por lo que puedo decir, no hay servicios serios en la nube de Mac OS X). Una vez que tienes un escritorio remoto, estás en el negocio. Aprender a escalar es el siguiente paso.
Actualización 1: Otros servicios de administración en la nube más generales incluyen RighstScale y Scalr.
Actualización 2: Quiero enfatizar que aprender a configurar sus instancias y clústeres en la nube es importante. Entre los beneficios del trabajo práctico:
gputools
)Hay beneficios al usar un proveedor administrado, como una curva de aprendizaje más corta, posiblemente un mejor soporte para compartir recursos entre un grupo y quizás algunos buenos artilugios, pero no puedo hablar de los beneficios cuando comencé a usar EC2 antes de cualquiera de estos Llegó al mercado.
También hay PiCloud para ejecutar código Python en paralelo en EC2.
Desde su página de producto :
PiCloud es una plataforma de computación en la nube que se integra en el lenguaje de programación Python. Le permite aprovechar la potencia informática de Amazon Web Services sin tener que administrar, mantener o configurar servidores virtuales.
PiCloud se integra perfectamente en su base de código existente a través de una biblioteca Python personalizada, en la nube. Para descargar la ejecución de una función a nuestros servidores, todo lo que debe hacer es pasar la función deseada a la biblioteca en la nube. PiCloud ejecutará la función en su clúster de alto rendimiento. A medida que ejecuta más funciones, nuestro clúster se escala automáticamente para satisfacer sus necesidades computacionales. ¡Subirse a la nube nunca ha sido tan fácil!
¿Intentaste CloudStat antes? A diferencia de otras nubes, CloudStat está destinado solo para usuarios de R Language. No hay más configuraciones. solo puede iniciar sesión y usar hasta 7.5 Gb de RAM de forma gratuita.
Sin embargo, con una cuenta gratuita, su análisis será visto y utilizado por el público. La opción es pagar $ 5 por mes para que su análisis sea privado.
Una plataforma de computación en la nube que puedo recomendar es Backbone, que proporciona una plataforma segura de computación en la nube que mejora la productividad .