Esto no será tanto una respuesta como un comentario.
La calidad depende de varias cosas, incluyendo (como Aaron dijo anteriormente) 1) el par de idiomas y 2) el tema, pero también 3) los géneros y 4) el estilo del original y 5) la cantidad de texto paralelo que tiene para entrenar el sistema MT.
Para establecer el escenario, prácticamente todo el MT en estos días se basa en textos paralelos, es decir, un texto en dos idiomas diferentes, presumiblemente uno es una traducción del otro (o ambos son una traducción de algún tercer idioma); y potencialmente usando diccionarios (quizás asistidos por procesos morfológicos) como retroceso cuando los textos paralelos no contienen palabras particulares.
Además, como han dicho otros, un sistema de MT de ninguna manera comprende los textos que está traduciendo; solo ve cadenas de caracteres y secuencias de palabras formadas por caracteres, y busca cadenas y secuencias similares en textos que se tradujeron anteriormente. (Ok, es un poco más complicado que eso, y ha habido intentos de llegar a la semántica en los sistemas computacionales, pero por ahora se trata principalmente de cadenas).
1) Los idiomas varían. Algunos idiomas tienen mucha morfología, lo que significa que hacen cosas con una sola palabra que otros idiomas hacen con varias palabras. Un ejemplo simple sería español 'cantaremos' = inglés "vamos a cantar". Y un idioma puede hacer cosas con las que el otro idioma ni siquiera se molesta, como la distinción informal / formal (tu / usted) en español, a la que el inglés no tiene un equivalente. O un idioma puede hacer cosas con la morfología que otro idioma hace con el orden de las palabras. O el guión que usa el idioma puede que ni siquiera marque los límites de las palabras (chino y algunos otros). Cuanto más diferentes sean los dos idiomas, más difícil será para el sistema MT traducir entre ellos. Los primeros experimentos en MT estadística se realizaron entre francés e inglés,
2) Tema: Si tiene textos paralelos en la Biblia (lo cual es cierto para casi cualquier par de idiomas escritos), y entrena su sistema MT fuera de esos, no espere que funcione bien en textos de ingeniería. (Bueno, la Biblia es una cantidad relativamente pequeña de texto según los estándares de entrenamiento de los sistemas de MT de todos modos, pero pretende :-).) El vocabulario de la Biblia es muy diferente al de los textos de ingeniería, y también lo es la frecuencia de varios gramática. construcciones (La gramática es esencialmente la misma, pero en inglés, por ejemplo, obtienes mucha más voz pasiva y más sustantivos compuestos en textos científicos y de ingeniería).
3) Genera: si su texto paralelo es todo declarativo (como en los manuales de tractores, por ejemplo), intentar usar el sistema MT resultante en el diálogo no le dará buenos resultados.
4) Estilo: Piensa en Hilary vs. Donald; erudito vs. popular. El entrenamiento en uno no obtendrá buenos resultados en el otro. Asimismo, capacitar el sistema de MT en novelas para adultos y usarlo en libros para niños.
5) Par de idiomas: el inglés tiene muchos textos, y las posibilidades de encontrar textos en algún otro idioma que sean paralelos a un texto en inglés dado son mucho mayores que las posibilidades de encontrar textos paralelos en, por ejemplo, ruso e igbo. (Dicho esto, puede haber excepciones, como los idiomas de la India). Como una generalización general, cuantos más textos paralelos tenga para entrenar el sistema MT, mejores resultados.
En resumen, el idioma es complicado (por eso me encanta, soy lingüista). Por lo tanto, no sorprende que los sistemas MT no siempre funcionen bien.
Por cierto, los traductores humanos tampoco siempre lo hacen tan bien. Hace una o dos décadas, estaba obteniendo traducciones de documentos de traductores humanos al inglés, para utilizarlas como materiales de capacitación para sistemas MT. Algunas de las traducciones eran difíciles de entender, y en algunos casos donde obtuvimos traducciones de dos (o más) traductores humanos, era difícil creer que los traductores habían estado leyendo los mismos documentos.
Y finalmente, hay (casi) nunca solo una traducción correcta; existen múltiples formas de traducir un pasaje, que pueden ser más o menos buenas, dependiendo de qué características (corrección gramatical, estilo, consistencia de uso, ...) desee. No hay una medida fácil de "precisión".