Hace unos meses hice una pasantía en esta organización; y, como regalo de despedida, decidí pasar la última semana, con el tiempo libre que tenía, para investigar los factores que afectan los salarios de los maestros. Un problema con el que me encontré con los salarios de los maestros fue que la distribución para el estado dado era sesgada. Tuve muchas observaciones que se aferraron al extremo inferior del espectro salarial. Intenté resolver esto incorporando un Índice de Salarios Comparables en mi variable dependiente (salarios de los maestros), pero los resultados que encontré estaban completamente desactualizados para el alcance de mi proyecto. En cambio, decidí registrar mi variable dependiente. Esto fue bueno porque ahora mi salario tenía una distribución normal y se veía perfecto en el histograma. Cuando comencé a probar, llegué al punto donde me quedaba una última variable independiente, las declaraciones de impuestos a la propiedad. El problema con mis salarios normativos también fue evidente en mis observaciones sobre la declaración de impuestos sobre la propiedad. Tuve un gran sesgo de los números de declaración de impuestos sobre la propiedad hacia el extremo inferior del espectro. Entonces, también registré esta variable y todavía pasó la prueba de hipótesis nula muy bien.
No estoy seguro de si esto es exactamente correcto, pero al comparar el cambio de una variable registrada con otra variable registrada me dio la elasticidad. Suponiendo que esto es correcto, mi ecuación de regresión (algo así como LogWages = B0 + B1 (LogPropertyTaxReturns)) muestra la elasticidad entre las dos variables. ¿Es esto significativo? Si mi objetivo era ver qué variable afectaba más los salarios de los docentes en cualquier condado de mi estado, ¿es útil mostrar la elasticidad entre las dos variables? Queremos aumentar los condados con los salarios docentes más bajos para aumentar sus niveles de vida, pero me temo que he extrapolado tan lejos de las observaciones reales que mi ecuación de regresión concluyente no tiene sentido.
Editar: Uno de mis mayores temores es que debería haber usado un modelo no lineal para mostrar la relación. Siento que obligar a la variable dependiente e independiente a cooperar en esta regresión lineal es engañoso de alguna manera.