¿Hay servicios gratuitos en la nube para entrenar modelos de aprendizaje automático?


27

Quiero entrenar un modelo profundo con una gran cantidad de datos de entrenamiento, pero mi escritorio no tiene ese poder para entrenar un modelo tan profundo con estos datos abundantes.

¿Me gustaría saber si hay algún servicio gratuito en la nube que pueda utilizarse para entrenar modelos de aprendizaje automático y aprendizaje profundo?

También me gustaría saber si hay un servicio en la nube, donde podría rastrear los resultados de la capacitación, y la capacitación continuaría incluso si no estoy conectado a la nube.

Respuestas:


19

No hay servicios gratuitos ilimitados *, pero algunos tienen crédito inicial u ofertas gratuitas en el registro inicial. Aquí hay algunos sugeridos hasta la fecha:

  • AWS: si el aprendizaje profundo específico en un conjunto de datos grande, entonces probablemente AWS está fuera, su oferta gratuita no cubre máquinas con suficiente potencia de procesamiento para abordar proyectos de aprendizaje profundo.

  • Google Cloud podría hacerlo, la oferta de crédito inicial es lo suficientemente buena como para hacer un poco de aprendizaje profundo (por quizás un par de semanas), aunque tienen restricciones de registro e impuestos.

  • Azure tiene un nivel gratuito con opciones limitadas de procesamiento y almacenamiento.

La mayoría de las ofertas gratuitas parecen seguir el modelo "Freemium": le brinda un servicio limitado que puede aprender a usar y tal vez le guste. Sin embargo, no es suficiente para usar mucho (por ejemplo, para entrenar un reconocedor de imágenes o un modelo de PNL desde cero) a menos que esté dispuesto a pagar.

El mejor consejo es darse una vuelta por la mejor oferta inicial y el mejor precio. Una revisión de los servicios no es adecuada aquí, ya que se desactualizará rápidamente y no será un buen uso de Stack Exchange. Pero puede encontrar preguntas similares en Quora y otros sitios: su mejor opción es hacer una búsqueda en la web de "servicios de computación en la nube para aprendizaje profundo" o similar y esperar pasar algún tiempo comparando notas. Recientemente han aparecido algunos servicios especializados de aprendizaje profundo como Nimbix o FloydHub , y también están los grandes jugadores como Azure, AWS, Google Cloud.

No encontrará nada completamente gratuito y sin trabas, y si desea hacerlo rutinariamente y tiene tiempo para construir y mantener hardware, es más barato comprar su propio equipo a largo plazo, al menos a nivel personal.

Para decidir si pagar por la nube o construir la suya, considere un precio típico para una máquina en la nube adecuada para realizar un aprendizaje profundo a alrededor de $ 1 por hora (los precios varían mucho, y vale la pena comprar, aunque solo sea para encuentre una especificación que coincida con su problema). Puede haber tarifas adicionales por almacenamiento y transferencia de datos. Compare eso con las máquinas de aprendizaje profundo prefabricadas que cuestan desde $ 2000, o construya la suya propia por $ 1000 ; tales máquinas pueden no ser 100% comparables, pero si trabaja solo, el punto de recuperación será después de unos pocos meses de uso Aunque no olvide los costos de electricidad: una máquina potente puede consumir 0.5kW mientras se usa mucho, por lo que esto suma más de lo que podría esperar.

Las ventajas de la computación en la nube son que otra persona realiza el trabajo de mantenimiento y asume el riesgo de fallas de hardware. Estos son servicios valiosos y tienen un precio acorde.


* Pero vea la respuesta de Jay Speidall sobre el servicio de Google Colab, que parece ser de uso gratuito, pero puede tener algunas limitaciones de T&C que pueden afectarlo (por ejemplo, dudo que estén contentos de que ejecute la producción de contenido de Deep Dream o Style Transfer en eso)


"No hay servicios gratuitos" <- esto no es cierto
Gaius

2
@Gaius He agregado corrección para Colab: puedo ver que su respuesta agrega Azure (con limitaciones estrictas). En mi opinión, "1 hora por experimento" está bien para los principios básicos de autoaprendizaje del aprendizaje profundo. No es de mucha utilidad para una investigación seria. No se pudo usar para la mayoría de las competiciones de Kaggle. Todavía recomendaría un servicio pago o compile el suyo anteriormente usando Azure gratis. Por supuesto, lo que Microsoft espera es que entrenes en su sistema y luego actualices para hacer un trabajo real.
Neil Slater

Saludos :-) ¡Disfruta el resto del feriado bancario!
Cayo el

@Gaius: ¡Gracias! De hecho, he hecho de esta respuesta un wiki de la comunidad para que, con suerte, deje de actualizarse.
Neil Slater

2
@Media: puedo mantener el representante hasta ahora. Al convertirlo en un wiki comunitario, otras personas pueden actualizarlo con más información. Espero agregar servicios de renombre y más o menos el aspecto de su nivel de servicio gratuito. Docenas de respuestas de "actualización" con los últimos cambios en el entorno de aprendizaje profundo SaaS / IaaS podrían dificultar la lectura de la página.
Neil Slater

18

Quiero agregar un recurso más, Google Colaboratory . Es un portátil gratuito de iPython en la nube y le ofrece el uso gratuito de una GPU. Todavía no estoy seguro de las limitaciones exactas, pero parece que obtienes 12 horas de tiempo de GPU por instancia y puedes hacerlo varias veces al mes.

Esto parece un gran recurso para estudiantes y otros no profesionales, especialmente para trabajos más pequeños que puede ejecutar en medio día. Básicamente, le ahorra hasta $ 10 por sesión de capacitación, que en mi opinión es un recurso bastante significativo para la investigación del aprendizaje automático. Realmente espero que no se abuse de ella.


3
Parece que será gratis indefinidamente.
Jay Speidell

1
Las GPU NVIDIA Tesla T4 se agregaron recientemente ...
Benj


11

Si, con limitaciones. Google Cloud Compute le ofrece 300 dólares de suscripción de crédito gratuita, y Microsoft Azure le da 200 dólares (pero su tiempo de GPU es un poco más barato, por lo que es casi lo mismo).

Esto le brinda mucho tiempo de GPU y lo ayudará a comenzar mientras evalúa sus opciones.


1
Ha habido algunas sugerencias de edición y confusión en torno a esto. De hecho, Google Cloud ofrece instancias de GPU e incluso TPU y su crédito es elegible para esto. De hecho, lo estoy usando mientras hablamos con los portátiles Jupyter respaldados por GPU.
Jay Speidell

¿la carga tiene alguna limitación para las horas libres? ¿Sabes que es más fuerte que su sistema Colab? Y finalmente, ¿sabes cuántas horas es gratis?
Medios

Para las pruebas de "crédito gratis" que ofrecen varios servicios, obtiene acceso completo a todos los servicios sin restricciones. El crédito solo se aplica a su factura. Colab está limitado a 12 GB de RAM, por lo que configurar Jupyter en una instancia de Compute Engine le daría muchas más opciones de recursos.
Jay Speidell

1

Azure Machine Learning Studio de Microsoft tiene un nivel "siempre gratuito", sujeto a ciertas limitaciones , que incluyen

  • 100 módulos por experimento (un "módulo" en Azure-speak es cualquier operación discreta como "cargar datos" o "modelo de tren", por lo que puede hacer bastante con 100 de ellos)
  • 10Gb de almacenamiento
  • 1 hora por experimento
  • Sin ejecución paralela en múltiples nodos

El entrenamiento continuará ejecutándose mientras no esté conectado, para responder su segunda pregunta. Puede configurar sus experimentos a través de la interfaz web o en la línea de comandos .


1

El cuerpo de la pregunta pregunta sobre el aprendizaje profundo, pero es la primera pregunta que surge cuando se busca "servicio en línea gratuito para aprendizaje automático".

Quería agregar que también hay otros servicios gratuitos de ML en línea.

Soy el fundador de uno de esos servicios con un nivel gratuito ( fml.ai ) que se ejecuta en AWS / Google Cloud. Nuestra interfaz de usuario está diseñada para ser intuitiva, explicarse por sí misma y utilizar tecnología curada interna y de código abierto. Por supuesto, existen limitaciones para el nivel gratuito y, actualmente, solo se permiten conjuntos de datos de hasta 100 MB. Aún así, los usuarios pueden construir modelos y visualizar resultados de forma gratuita.

Creo que también hay otros por ahí ...


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.