Lo que necesita es una revisión sólida de la metodología de regresión. Sin embargo, estas preguntas son lo suficientemente básicas (no lo tome de la manera incorrecta) que incluso una buena descripción general de las estadísticas básicas probablemente lo beneficiaría. Howell ha escrito un libro de texto muy popular que proporciona una base conceptual amplia sin requerir matemáticas densas. Bien puede valer la pena leerlo. No es posible cubrir todo ese material aquí. Sin embargo, puedo tratar de ayudarlo a comenzar con algunas de sus preguntas específicas.
Primero, los días de la semana se incluyen a través de un esquema de codificación. La más popular es la codificación de 'categoría de referencia' (típicamente llamada codificación ficticia). Imaginemos que sus datos están representados en una matriz, con sus casos en filas y sus variables en columnas. En este esquema, si tuviera 7 variables categóricas (por ejemplo, para los días de la semana) agregaría 6 nuevas columnas. Elegiría un día como categoría de referencia, generalmente el que se considera el predeterminado. A menudo esto se basa en la teoría, el contexto o la pregunta de investigación. No tengo idea de cuál sería el mejor para los días de la semana, pero tampoco importa mucho, puedes elegir uno viejo. Una vez que tenga la categoría de referencia, puede asignar las otras a sus nuevas 6 variables, luego simplemente indique si esa variable se obtiene para cada caso. Por ejemplo, supongamos que elige el domingo como categoría de referencia, sus nuevas columnas / variables serían de lunes a sábado. Cada observación que tuvo lugar un lunes se indicaría con un10 010 0
Ha pasado mucho tiempo desde que vi cómo Excel hace estadísticas, y no lo recuerdo muy claramente, por lo que alguien más puede ayudarlo más allí. Esta página parece tener información sobre los detalles de la regresión en Excel. Puedo contarles un poco más sobre las estadísticas que generalmente se informan en la salida de regresión:
- r1
- rrrrr
- rr×r10r1R21rR2) está muy sesgado en la regresión múltiple. Es decir, cuantos más predictores agregue a su modelo, más altas serán estas estadísticas, ya sea que haya alguna relación o no. Por lo tanto, debe tener cuidado al interpretarlos.
- tF
- p
- tFpF1F
- FF
Un último punto que vale la pena destacar es que este proceso no puede separarse de su contexto. Para hacer un buen trabajo de análisis de datos, debe tener en cuenta sus conocimientos previos y la pregunta de investigación. Aludí a esto anteriormente con respecto a la elección de la categoría de referencia. Por ejemplo, observa que el tamaño del zapato no debería ser relevante, ¡pero para los Picapiedra probablemente lo fue! Solo quiero incluir este hecho, porque a menudo parece ser olvidado.