Haga que la etiqueta del usuario resalte los objetos en video que un clasificador de vanguardia no puede resolver
Cree un clasificador de video de última generación. También podría entrenarlo en los datos de entrenamiento de video YouTube-8M de Google . Pero también querrás transmitir continuamente el video original.
Haga que el clasificador etiquete tantos objetos como pueda. Haga que aísle qué objetos puede reconocer como objetos pero que no puede etiquetar.
Haga que muestre videos que describan los objetos. Preferiblemente GIF, que se pueden incrustar fácilmente en formularios.
Para 100 de estos, pregunte a 100 usuarios cuál es el objeto. Si el 90% de los usuarios están de acuerdo con el nombre de un objeto, agregue ese video al conjunto de captcha. Llame a esto el conjunto pre-entrenado.
Cada vez que un usuario necesite autenticarse, muéstrele uno de los objetos resaltados en un video que no sea del conjunto previamente entrenado . Si la imagen tiene menos de 100 presentaciones, grabe la etiqueta y dele al usuario otra del conjunto previamente entrenado. Si lo hacen bien, déjalos pasar, si no, dales otro del conjunto entrenado previamente.
Una vez que el video no entrenado previamente tiene más de 100 proyecciones y más del 90% de los usuarios de captcha están de acuerdo, agregue ese video al conjunto posterior al entrenamiento.
Con el tiempo, retire lentamente el conjunto pre-entrenado. Ponga vencimientos en cada video en el conjunto de entrenamiento posterior y elimínelos después del vencimiento, para que no se usen demasiadas veces.
Idealmente, este proceso mejoraría constantemente el clasificador de video, manteniéndolo a la vanguardia y ligeramente por delante de otros clasificadores. Quizás también podría favorecer palabras y objetos menos comunes y cosas más esotéricas, para especializar este clasificador frente a otros clasificadores.
Lo mismo podría hacerse para el etiquetado de imágenes, pero la utilidad del clasificador de video probablemente durará más tiempo, dados los avances en IA.
Estrictamente hablando, sin embargo, a falta de algunos trucos cuánticos, no hay un sistema de captcha que algún día no sea resuelto por sistemas de IA externos.
(editar: oh, acabo de notar que dijiste específicamente "captcha textual". Si eso es lo que quieres decir, entonces no creo que la clasificación de texto tenga mucho misterio. Las computadoras probablemente pueden obtener texto de imágenes mejor que los humanos ahora. Pero técnicamente, la entrada en el sistema captcha descrito anteriormente es textual).