En Econometría, diríamos que la no normalidad viola las condiciones del Modelo de regresión lineal normal clásico, mientras que la heterocedasticidad viola tanto los supuestos del CNLR como el Modelo de regresión lineal clásica.
Pero aquellos que dicen "... viola OLS" también están justificados: el nombre de Mínimos Cuadrados Ordinarios proviene de Gauss directamente y esencialmente se refiere a errores normales . En otras palabras, "OLS" no es un acrónimo para la estimación de mínimos cuadrados (que es un principio y enfoque mucho más general), sino del CNLR.
Ok, esto fue historia, terminología y semántica. Entiendo el núcleo de la pregunta del OP de la siguiente manera: "¿Por qué deberíamos enfatizar el ideal, si hemos encontrado soluciones para el caso cuando no está presente?" (Debido a que las suposiciones CNLR son ideales, en el sentido de que proporcionan excelentes propiedades de estimador de mínimos cuadrados "disponibles en el mercado", y sin la necesidad de recurrir a resultados asintóticos. Recuerde también que OLS es la máxima probabilidad cuando los errores son normales )
Como ideal, es un buen lugar para comenzar a enseñar . Esto es lo que siempre hacemos al enseñar cualquier tipo de tema: las situaciones "simples" son situaciones "ideales", libres de las complejidades que uno realmente encontrará en la vida real y la investigación real, y para las cuales no existen soluciones definitivas .
Y esto es lo que me parece problemático acerca de la publicación del OP: escribe sobre errores estándar robustos y bootstrap como si fueran "alternativas superiores", o soluciones infalibles a la falta de dichos supuestos en discusión para los cuales, además, el OP escribe
"... supuestos que la gente no tiene que conocer"
¿Por qué? Debido a que hay algunos métodos para lidiar con la situación, ¿métodos que tienen cierta validez, por supuesto, pero están lejos de ser ideales? Los errores estándar robustos de bootstrap y heteroscedasticidad no son las soluciones: si lo fueran, se habrían convertido en el paradigma dominante, enviando el CLR y el CNLR a los libros de historia. Pero no lo son.
Entonces, partimos del conjunto de supuestos que garantizan las propiedades del estimador que hemos considerado importantes (es otra discusión si las propiedades designadas como deseables son realmente las que deberían ser), de modo que mantengamos visible que cualquier violación de ellas tiene consecuencias que no pueden ser completamente compensadas a través de los métodos que hemos encontrado para lidiar con la ausencia de estos supuestos. Sería realmente peligroso, científicamente hablando, transmitir la sensación de que "podemos adelantarnos hacia la verdad del asunto", porque, simplemente, no podemos.
Por lo tanto, siguen siendo soluciones imperfectas a un problema , no una forma alternativa y / o definitivamente superior de hacer las cosas. Por lo tanto, primero tenemos que enseñar la situación libre de problemas, luego señalar los posibles problemas y luego discutir posibles soluciones. De lo contrario, elevaríamos estas soluciones a un estado que realmente no tienen.