Aquí está la explicación directamente de la fuente (casi)
al mínimo 22:03
¡Vale la pena ver!
Básicamente y de acuerdo con Douglas Merrill, ex director de tecnología de Google, es así:
1) Escribe una palabra (mal escrita) en google
2) No encuentras lo que buscabas (no hagas clic en ningún resultado)
3) Te das cuenta de que escribiste mal la palabra y reescribes la palabra en el cuadro de búsqueda.
4) Encuentra lo que buscas (haces clic en los primeros enlaces)
Este patrón multiplicado millones de veces, muestra cuáles son los errores ortográficos más comunes y cuáles son las correcciones más "comunes".
De esta forma, Google puede, casi instantáneamente, ofrecer corrección ortográfica en todos los idiomas.
Esto también significa que si de la noche a la mañana todos comienzan a deletrear la noche como "noche", Google sugeriría esa palabra.
EDITAR
@ThomasRutter: Douglas lo describe como "aprendizaje automático de estadística".
Saben quién corrige la consulta, porque saben qué consulta proviene de qué usuario (usando cookies)
Si los usuarios realizan una consulta, y solo el 10% de los usuarios hacen clic en un resultado y el 90% regresa y escribe otra consulta (con la palabra corregida) y esta vez ese 90% hace clic en un resultado, entonces saben que han encontrado Una corrección.
También pueden saber si esas son consultas "relacionadas" de dos diferentes, porque tienen información de todos los enlaces que muestran.
Además, ahora están incluyendo el contexto en el corrector ortográfico, por lo que incluso pueden sugerir palabras diferentes según el contexto.
Vea esta demostración de google wave (@ 44m 06s) que muestra cómo se tiene en cuenta el contexto para corregir automáticamente la ortografía.
Aquí se explica cómo funciona el procesamiento del lenguaje natural.
Y finalmente, aquí hay una demostración impresionante de lo que se puede hacer agregando traducción automática (@ 1h 12m 47s) a la mezcla.
Agregué anclas de minutos y segundos a los videos para saltar directamente al contenido; si no funcionan, intente volver a cargar la página o desplazarse manualmente hasta la marca.