¡Esto es lo que hago! Se han escrito muchos, muchos libros excelentes sobre el tema, pero como una breve lista de viñetas, centrada especialmente en los sistemas integrados para el uso del espacio:
En general, utilizamos muchas de las prácticas de diseño de alta confiabilidad aprendidas durante muchas décadas de lecciones aprendidas de la defensa, la aviación e incluso la automotriz (controladores de frenos, ABS). Esto incluye métodos de tolerancia a fallas (n-redundancia, a prueba de fallas, etc.), análisis riguroso y control de calidad de software y hardware, y el cumplimiento de los muchos estándares escritos sobre el tema. (Especialmente crítico si trabaja para un trabajo tradicional ambiente espacial).
Para la electrónica específicamente, la radiación ionizante y la falta de magnetosfera de la Tierra es la más importante. Como simplificación excesiva, podemos dividirnos en dos clases: dosis de ionización total (TID) y efectos de evento único . Ambos tienen mitigaciones que van desde arrojar mucho dinero en hardware especializado y soluciones inteligentes de software / diseño que pueden mitigar los efectos lo suficiente de una manera mucho más barata.
TID es exactamente lo que parece: con el tiempo, acumula daños por radiación ionizante y, finalmente, sus semiconductores dejan de convertirse en semiconductores. Los efectos varían enormemente según el tamaño del proceso, la composición y muchos otros efectos a nivel de dispositivo, pero los efectos que puede ver incluyen el cambio de voltaje umbral MOSFET: imagine un MOSFET de canal N cuyo Vt se desplaza lentamente hacia abajo hasta que siempre está encendido. Se han desarrollado algunos procesos increíblemente endurecidos para admitir cantidades de dosis muy altas: la misión Juno destinada a Júpiter tiene un hardware increíble dentro de una bóveda masiva y literal .
Una nota al margen sobre TID, ya que, por supuesto, los efectos de la radiación también son de interés para aplicaciones terrestres como las armas nucleares, las pruebas a menudo se realizan a dosis altas y bajas. Algunos dispositivos semiconductores expresan resultados diferentes para ambos: por ejemplo, un artículo que leí sometió a un LDO a tasas de dosis altas y bajas. Uno degradó el circuito de banda prohibida de Brokaw, bajando el voltaje de salida con el tiempo. El otro degradó la beta del transistor de salida, reduciendo la corriente de salida con el tiempo.
Los efectos de eventos únicos también se pueden observar en la Tierra: la mayoría de las personas están familiarizadas con las memorias DDR ECC para aplicaciones críticas, por ejemplo. Además, la mayoría de las aeronaves comerciales deben tener esto en cuenta debido a que su altitud de operación es lo suficientemente alta como para que los neutrones de alta energía puedan causar un mal funcionamiento del circuito electrónico. Esto se conoce popularmente como 'cambios de bits': una partícula energética viaja a través de un circuito, impartiendo una transferencia de energía lineal (LET) que puede ser suficiente para causar un trastorno de bits (SEU), una condición de retención ( SEL) que conduce a un consumo de alta corriente debido al comportamiento parasitario de BJT, la ruptura de la puerta MOSFET (SEGR) y el agotamiento (SEB). En términos generales, puede clasificar cualquier evento que resulte en una falla del sistema como SEFI: interrupción funcional de evento único.
Llamaré específicamente al cierre . Existen especificaciones terrestres para el enganche que se encuentran bajo JESD78, pero no están diseñadas para condiciones de enganche inducidas por radiación. El mecanismo es similar entre los dos: una estructura NPN parásita se puede energizar en la construcción CMOS convencional, lo que hace que se cree una ruta de baja impedancia desde la alimentación a tierra. Esto, por supuesto, dará como resultado grandes cantidades de corrientes que fluyen a través de una parte del chip que nunca fue diseñada para ello. Recordando los cables de enlace de densidades de corriente y varias porciones de los troqueles están diseñados para, si esta situación no se soluciona, ese chip morirá una muerte ardiente. Una mitigación común es un sensor de corriente aguas arriba que reacciona para cortar la fuente de alimentación y quitar el seguro.
En términos de software y procesadores, lo resumí en dos problemas principales. Uno es proteger la memoria volátil : registrar archivos, RAM (SRAM / DRAM), etc. Sería desafortunado si el registro de su PC tomó un SEU y de repente se saltó a otro lugar. En segundo lugar, está protegiendo no volátilmemoria: su software es inútil si se corrompe y no se puede ejecutar. La protección volátil habitual es ECC (SECDED por lo general) más la búsqueda continua de errores. Para los no volátiles, es mucho más difícil: grandes cantidades de memoria endurecida son increíblemente caras de comprar, en detrimento de las misiones científicas de la NASA / ESA. Algunas personas usan redundancia n, otras usan tecnologías reforzadas de forma nativa como MRAM o FRAM (hasta cierto punto, para el trabajo COTS) y otras pagan a los proveedores más de seis cifras por almacenamiento de alta confiabilidad y misión crítica.
Mecánicamente, al menos en órbita LEO, estás haciendo un ciclo térmico entre el sol y la oscuridad cada 45 minutos. Esto se suma a la necesidad de sobrevivir a los rigores del lanzamiento: mis colegas mecánicos también tienen un conjunto de requisitos que diseñan (creo que parte de ellos son GEVS ) para asegurarnos de que sobrevivamos al lanzamiento de un cohete de alta G. Realizan una cantidad impresionante de análisis y pruebas previas al lanzamiento para asegurarse de que no nos convertimos en pedazos de restos en el camino. En el ensamblaje, evitamos el uso de soldaduras sin plomo y la capa de conformación de todos los ensambles eléctricos.
Térmicamente, no hay convección en el espacio. Para circuitos integrados de alta potencia, el único camino para la transferencia de calor es la radiación y la conducción. Se deben considerar diseños interesantes de disipadores de calor para eliminar efectivamente el calor de un dispositivo utilizando solo esos dos métodos. Además, las pruebas en el terreno se convierten en hardware porque no solo necesita una cámara térmica, sino que también necesita una cámara de vacío. Aquí hay algunas fotos de las cámaras TVAC de JPL.
Trabajando en un "nuevo espacio", donde la gente no está construyendo aves GEO / MEO masivas que apoyan la seguridad nacional crítica o las necesidades comerciales, a menudo las piezas COTS se trasladan después de someterse a pruebas / análisis en el terreno para ver cómo les va. Si bien uno puede comprar una compuerta quad-NAND 74xx00 tolerante a cientos de krad, lista para volar por unos pocos cientos de dólares, algunas personas pueden probar lotes de 74LVC00 o partes similares para ver cómo les va también. Todo está en la cantidad de riesgo que está dispuesto a tolerar.
Mi experiencia es en el diseño de electrónica automotriz, de consumo e industrial, antes de ingresar al trabajo espacial. Por lo tanto, a menudo mi proceso de pensamiento es "hombre, ¡voy a usar esa parte monolítica, de baja potencia y de vanguardia! Oh, espera, espacio". Por lo general, esto se reemplaza pensando en cuán discreto y minimizado puedo hacer esa solución para un componente estable de componentes resistentes a la radiación o resistentes a la radiación basados en el conocimiento (ya sea de las pruebas o predicciones basadas en la tecnología de proceso) de su radiación actuación.
Si esta respuesta despierta más interés, es probable que retroceda para completarla / editarla para que sea más limpia.