Después de buscar una aclaración sobre los coeficientes del modelo lineal aquí , tengo una pregunta de seguimiento relativa a los no significativos (valor p alto) para los coeficientes de los niveles de factores.
Ejemplo: si mi modelo lineal incluye un factor con 10 niveles, y solo 3 de esos niveles tienen valores de p significativos asociados con ellos, cuando uso el modelo para predecir Y, puedo elegir no incluir el término del coeficiente si el sujeto cae en uno de el nivel no significativo?
Más drásticamente, ¿sería incorrecto agrupar los 7 niveles no significativos en un nivel y volver a analizar?