¿Hay algún desafío CAPTCHA textual que pueda engañar a la IA, pero no a los humanos?

10

¿Existen algunas técnicas modernas para generar desafíos textuales de CAPTCHA (por lo que la persona necesita escribir el texto correcto) que pueden engañar fácilmente a la IA con algunos métodos de ofuscación visual, pero al mismo tiempo los humanos pueden resolverlos sin ninguna dificultad?

Por ejemplo, estoy hablando de la capacidad simple de reconocer el texto incrustado en la imagen (sin considerar ningún complemento externo como flash o java, clasificación de imágenes, etc.) y volver a escribir el texto que se ha escrito o algo similar.

Supongo que agregar ruido, degradar, rotar letras o cambiar colores ya no son métodos confiables, ya que pueden romperse rápidamente.

¿Alguna sugerencia o investigación se ha realizado?

image-recognition research ocr

— kenorb
fuente

44

¿No es esto algo al revés? Por lo general, alguien primero hace un Captcha que cree que puede engañar a un bot, y luego otras personas comienzan a resolverlo automáticamente. Cualquier cosa nueva que se te ocurra se volverá obsoleta muy rápidamente.

— Lurker desencantado

Intenta pensar en lo que los humanos pueden hacer mejor que las computadoras. Podemos razonar y nosotros (hablantes nativos) conoceremos casi todos los idiomas. Vea esto para más ideas . Creo que, en lo que respecta al texto, lo mejor sería que el usuario ingrese el texto que se analiza con PNL para que coincida con un sentimiento declarado o tal vez exprese algo. Las computadoras no son muy buenas para redactar oraciones claras y bien estructuradas (pero supongo que la mayoría de los humanos tampoco lo son).

— JakeD

Por lo general, el CAPTCHA textual se usa para significar que el CATPCHA se presenta como texto, no que la entrada requerida por el usuario debe ser texto. Por ejemplo TextCaptcha .

— Theraot

5

Es una pregunta interesante sobre qué hace que los humanos sean únicos. Hay un buen libro sobre el tema titulado What Computers Cant Do by de Hubert Dreyfus .

Una tarea que una computadora no puede manejar (al menos por ahora) es clasificar cosas importantes. Por ejemplo, CAPTCHA le pide que ordene una lista aleatoria de cosas (uno pequeño, cinco o seis artículos) por importancia. Este ejercicio particular requiere que la IA tome decisiones (no siempre racionales) basadas en el juicio humano.

— kvfi
fuente

5

Un método que posiblemente podría funcionar es utilizar ilusiones ópticas, como una en la que dos líneas en un pasillo son idénticas pero una parece más larga para el ojo humano, entonces se les podría hacer una pregunta de opción múltiple sobre el estado de la línea, que nuestros ojos se ven más largos, pero para una computadora, todavía tiene la misma longitud de línea. Por supuesto, siempre existe el problema de que las personas con discapacidades oculares no puedan completarlas, pero se podrían usar diferentes ilusiones para adaptarse a eso.

Ejemplo

— sgtdragonfire
fuente

2

Haga que la etiqueta del usuario resalte los objetos en video que un clasificador de vanguardia no puede resolver

Cree un clasificador de video de última generación. También podría entrenarlo en los datos de entrenamiento de video YouTube-8M de Google . Pero también querrás transmitir continuamente el video original.

Haga que el clasificador etiquete tantos objetos como pueda. Haga que aísle qué objetos puede reconocer como objetos pero que no puede etiquetar.

Haga que muestre videos que describan los objetos. Preferiblemente GIF, que se pueden incrustar fácilmente en formularios.

Para 100 de estos, pregunte a 100 usuarios cuál es el objeto. Si el 90% de los usuarios están de acuerdo con el nombre de un objeto, agregue ese video al conjunto de captcha. Llame a esto el conjunto pre-entrenado.

Cada vez que un usuario necesite autenticarse, muéstrele uno de los objetos resaltados en un video que no sea del conjunto previamente entrenado . Si la imagen tiene menos de 100 presentaciones, grabe la etiqueta y dele al usuario otra del conjunto previamente entrenado. Si lo hacen bien, déjalos pasar, si no, dales otro del conjunto entrenado previamente.

Una vez que el video no entrenado previamente tiene más de 100 proyecciones y más del 90% de los usuarios de captcha están de acuerdo, agregue ese video al conjunto posterior al entrenamiento.

Con el tiempo, retire lentamente el conjunto pre-entrenado. Ponga vencimientos en cada video en el conjunto de entrenamiento posterior y elimínelos después del vencimiento, para que no se usen demasiadas veces.

Idealmente, este proceso mejoraría constantemente el clasificador de video, manteniéndolo a la vanguardia y ligeramente por delante de otros clasificadores. Quizás también podría favorecer palabras y objetos menos comunes y cosas más esotéricas, para especializar este clasificador frente a otros clasificadores.

Lo mismo podría hacerse para el etiquetado de imágenes, pero la utilidad del clasificador de video probablemente durará más tiempo, dados los avances en IA.

Estrictamente hablando, sin embargo, a falta de algunos trucos cuánticos, no hay un sistema de captcha que algún día no sea resuelto por sistemas de IA externos.

(editar: oh, acabo de notar que dijiste específicamente "captcha textual". Si eso es lo que quieres decir, entonces no creo que la clasificación de texto tenga mucho misterio. Las computadoras probablemente pueden obtener texto de imágenes mejor que los humanos ahora. Pero técnicamente, la entrada en el sistema captcha descrito anteriormente es textual).

— Doxosophoi
fuente