¿Alguna vez un error del comprobador de pruebas ha invalidado una prueba importante?

La mayoría de los asistentes de prueba (¿todos?) Tienen errores de solidez corregidos ocasionalmente. Sin embargo, de los que he visto, estos errores suelen ser difíciles de encontrar involuntariamente, y los resultados probados antes de que el error se solucione generalmente se mantienen después de la corrección.

Tres preguntas, en orden de fortaleza:

¿Alguna corrección de errores de sonido ha causado alguna falla importante en una prueba, sin modificar la prueba?
Si (1) es verdadero, ¿alguna vez se requirieron modificaciones importantes para arreglar la prueba?
Si (2) es cierto, ¿alguien ha demostrado un teorema mayor incorrecto debido a un error de solidez?

Dejaré la definición de "mayor" a otros.

proof-assistants soundness

— Geoffrey Irving
fuente

Esto probablemente muestra mi ignorancia, pero ¿alguna vez se estableció un teorema importante con un asistente de prueba? Por supuesto que sé sobre el teorema de los 4 colores y la conjetura de Kepler, pero no creo que las primeras pruebas allí usaran asistentes de prueba. Tengo curiosidad

— Sasho Nikolov

Creo que ningún humano había demostrado que un compilador era correcto, y había sido correcto al respecto, hasta CompCert. Pero tiene razón en que esto haría (3) en particular una pregunta menos interesante.

— Geoffrey Irving

@SashoNikolov: eso no es realmente relevante, ya que la mayoría de las pruebas realizadas en la práctica por asistentes de pruebas no son sobre matemáticas. Por lo general, se trata de sistemas de software, o de propiedades de sistemas formales, etc. (Es solo una cuestión de tiempo cuando la gran mayoría de las pruebas realizadas en este planeta no son pura matemática. Los robots están llegando). Sería bastante molesto. si, por ejemplo, alguien demostró usar un asistente de prueba que algún sistema crítico es seguro, y luego resultó que accidentalmente utilizó una inconsistencia.

— Andrej Bauer el

Gracias @AndrejBauer. ¿Entonces "prueba mayor" y "teorema mayor" aquí no significan mayor para matemáticos de investigación sino pruebas de corrección de sistemas críticos importantes?

— Sasho Nikolov

Creo que cualquier prueba que se considere importante por muchas personas (matemáticos, expertos en seguridad, ingenieros de software) contaría. Me temo que no vamos a averiguar porque si alguien hizo tropezar este problema, lo más probable es que en silencio lo arreglaron.

— Andrej Bauer el

Que yo sepa, ninguna prueba comprobada por máquina de un complejo desarrollo matemático ha sido retractada.

Como Andrej señala, sin embargo, que en ocasiones sucede que los errores de solidez sin precedentes no surgen en estos sistemas (aunque por lo general no en silencio , como sugiere Andrej), y la solución a ese error implica algunos cambios en las pruebas existentes, o, más probablemente, de la biblioteca estándar del sistema de prueba involucrado.

Algunos ejemplos de tales pruebas de ruptura de bibliotecas en Coq:

https://coq.inria.fr/bugs/show_bug.cgi?id=4294

https://sympa.inria.fr/sympa/arc/coq-club/2013-12/msg00119.html

Es difícil decir si las pruebas establecidas dependían de la inconsistencia, ya que después de la corrección, requirieron pequeños ajustes para ser aceptados por el verificador de pruebas. ¡Pero esto sucede en cada actualización no trivial!

Mi opinión personal es que es poco probable que ocurran tales errores, ya que la prueba en papel debe pulirse bien antes de que se pueda intentar la formalización de la máquina.

Las inconsistencias en los marcos de prueba generalmente requieren el uso intensivo de combinaciones extrañas de características esotéricas, y muy raramente surgen "por accidente".

— cody
fuente

Me refería a personas que solucionaban problemas en sus guiones de prueba en silencio , o incluso sin saberlo, como señaló Geoffrey, como una reacción a los errores en los asistentes de prueba. Por supuesto, las inconsistencias en los asistentes de pruebas siempre se reciben con un sorprendente nivel de emoción. Los matemáticos deberían tener una inconsistencia en las matemáticas, lo que daría lugar a un par de meses interesantes.

— Andrej Bauer

¿Qué pasa con las personas que me lanzan enlaces de Wikipedia? @RickyDemer, ¿podría explicar amablemente su punto? He oído hablar de la paradoja de Russell, ya sabes. Eso fue hace más de 100 años, y condujo a algunas excelentes matemáticas. Estoy proponiendo que estemos maduros para otro.

— Andrej Bauer

¡Aceptaré esta respuesta por ahora, pero por supuesto no la aceptaré si alguien responde en la otra dirección! (Revelación completa: esta era la respuesta que esperaba.)

— Geoffrey Irving

@GeoffreyIrving ¡La respuesta es algo insatisfactoria, ya que es difícil para mí demostrar una falta de retractaciones! Por lo tanto, la respuesta se basa necesariamente en mi falta de conocimiento, aunque ha habido tan pocas formalizaciones de máquinas a gran escala que al menos estoy un poco confiado en mi respuesta. También he oído que algunas formalizaciones importantes en el método B se han demostrado tener supuestos inconsistentes (necesita añadir muchos axiomas para los estados no triviales, y las colecciones de axiomas tomados juntos fueron posteriormente demostrado ser ...

— Cody

... inconsistente). Desafortunadamente, parece que no puedo encontrar una referencia para eso, así que no lo incluí en mi respuesta. También la formalización fue sobre un gran programa, y no sobre matemáticas puras.

— cody