Buena pregunta. En realidad, hay mucha confusión sobre este tema, principalmente porque ambos son trabajos bastante nuevos. Pero si nos centramos en la semántica, el verdadero significado de los trabajos se vuelve claro.
De antemano es mejor comparar manzanas con manzanas, hablando de un solo tema, los datos. El aprendizaje automático y su subgénero (aprendizaje profundo, etc.) son solo un aspecto del mundo de datos, junto con las teorías estadísticas, la adquisición de datos (DAQ), el procesamiento (que puede ser impulsado por el aprendizaje no automático), el interpretación de los resultados, etc.
Entonces, para mi explicación, ampliaré el rol de Ingeniero de Aprendizaje Automático al de Ingeniero de Datos.
La ciencia se trata de experimentos, ensayos y fracasos, construcción de teorías, comprensión fenomenológica. La ingeniería se trata de trabajar en lo que la ciencia ya sabe, perfeccionarlo y llevarlo al "mundo real".
Piensa en un proxy: ¿cuál es la diferencia entre un científico nuclear y un ingeniero nuclear?
El científico nuclear es el que conoce la ciencia detrás del átomo, la interacción entre ellos, el que escribió la receta que permite obtener energía de los átomos.
El ingeniero nuclear es el tipo encargado de tomar la receta del científico y llevarla al mundo real. Por lo tanto, su conocimiento sobre la física atómica es bastante limitado, pero también sabe sobre materiales, edificios, economía y cualquier otra cosa útil para construir una planta nuclear adecuada.
Volviendo al mundo de los datos, aquí hay otro ejemplo: los chicos que desarrollaron las redes neuronales convolucionales (Yann LeCun) son científicos de datos, el tipo que implementa el modelo para reconocer caras en imágenes es un ingeniero de aprendizaje automático. El responsable de todo el proceso, desde la adquisición de datos hasta el registro de la imagen .JPG, es un ingeniero de datos.
Entonces, básicamente, el 90% de los Data Scientist de hoy son en realidad Ingenieros de Datos o Ingenieros de Aprendizaje Automático, y el 90% de las posiciones abiertas como Data Scientist realmente necesitan Ingenieros. Una verificación fácil: en la entrevista, se le preguntará sobre cuántos modelos de ML desplegó en producción, no sobre cuántos documentos sobre los nuevos métodos que publicó.
En cambio, cuando vea anuncios sobre "Ingeniero de Aprendizaje Automático", eso significa que los reclutadores son conscientes de la diferencia, y realmente necesitan a alguien capaz de poner algún modelo en producción.
Data scientist
Suena como una designación con poca claridad sobre cuál será el trabajo real, mientras quemachine learning engineer
es más específico. En el primer caso, su empresa le dará un objetivo y usted necesita averiguar qué enfoque (aprendizaje automático, procesamiento de imágenes, red neuronal, lógica difusa, etc.) utilizaría. En el segundo caso, su compañía ya se ha reducido a qué enfoque debe usarse.