Hay varios ejemplos famosos donde la máxima verosimilitud (ML) no proporciona la mejor solución. Ver el artículo de 1990 de Lucien Le Cam: "Máxima probabilidad: una introducción" [1] , que es de sus conferencias invitadas en la Univ. de Maryland
El ejemplo que más me gusta, porque es muy sencillo, es este:
XjYjj=1,...,nXj∼N(μj,σ2)Yj∼N(μj,σ2)jXjYjjσ2
No arruinaré la diversión dándote la respuesta, pero (no es de extrañar) hay dos formas de resolver esto usando ML y ofrecen diferentes soluciones. Uno es la "media aritmética" de los residuos al cuadrado (como cabría esperar), y el otro es la mitad de la media aritmética. Puede encontrar la respuesta aquí en mi página de Github.