Trabajar alrededor
Como ChrisF sugiere, la solución pragmática a corto plazo puede ser utilizar el truco de pausa y reanudar , pero debe hablar con sus clientes para saber cuáles deberían ser sus prioridades. Por ejemplo:
Si la falla destruye una parte de £ 1000 o causa 4 horas de tiempo de inactividad una vez por semana, mientras que la corrección de pausa-reanudación reduce la producción en un 1%, probablemente preferirán la solución en este momento.
Si la falla destruye una parte de £ 1 o causa 4 minutos de tiempo de inactividad una vez a la semana, pero la solución pausa-reanudación reduce la producción en un 1%, probablemente preferirán esperar una solución que no afecte la tasa de producción.
Después de haber trabajado en la industria del micro maquinado por láser durante muchos años, sé cuánta presión puede estar bajo para optimizar el proceso y hacer que su máquina produzca tantas partes por hora como sea posible, por lo que de cualquier manera estará bajo presión para solucionar el problema correctamente.
Inicio sesión
En mi experiencia, la única forma de rastrear efectivamente un Heisenbug es un registro abundante. Registre todo en y alrededor de la parte del código que podría ser responsable del error. Aprenda a leer sus archivos de registro de manera efectiva, asegúrese de estar monitoreando el siguiente error en sus motores (¿sus etapas se mueven donde deberían cuando deberían?). Mire el uso de memoria en la máquina, ¿hay una pérdida de memoria que causa la falta de un proceso crítico?
Asegúrese de registrar también las acciones de los usuarios, ¿está seguro de que el operador no está presionando la parada de emergencia para que pueda salir por un breve cambio de cigarrillo mientras se está reparando? ¡He visto que esto suceda!
Análisis estático
Además, busque correlaciones entre escribir ciertos patrones y que el error se active con mayor o menor frecuencia. Si puede encontrar patrones que desencadenan el problema con mayor frecuencia (o nunca lo desencadenan), esto puede indicar su problema.
Trate de hacer patrones que desencadenen el problema con mayor frecuencia. Si puede encontrar una manera de desencadenar el problema de manera confiable, entonces está a medio camino de una solución.
Otras opciones
Finalmente, no se apresure a culpar al hardware, pero nunca asuma que es perfecto. Muchas veces me han culpado por problemas que resultaron ser de naturaleza eléctrica o mecánica, por lo que siempre debe tener eso en mente.
Aunque normalmente no tenga acceso a la máquina, recuerde que algunos problemas solo pueden resolverse de manera eficiente en la máquina. A veces, unos pocos días en el sitio pueden valer semanas a través del escritorio remoto y meses completamente fuera de línea. Si te quedas sin opciones fuera de línea, no tengas miedo de proponer una visita al sitio, solo pueden decir que no.
También es posible que desee ver las preguntas y respuestas a ¿Qué hace con un heisenbug? y ¿Qué hacer con los errores que no reprochan? pero estos podrían no ser tan útiles para su situación.