¿Cuál es el punto de informar estadísticas descriptivas?


21

Acabo de llevar a cabo un análisis de mis datos mediante regresión logística, sin embargo, también tengo que tener una parte de Estadística descriptiva en mi informe. Sinceramente, no veo el punto en esto y esperaba que alguien pudiera explicar por qué es necesario.

Por ejemplo, si trazo un histograma de una de mis variables continuas independientes y muestra normalidad o asimetría, ¿cómo agregará esto algún valor al informe?

Mis datos consisten en una variable dependiente verdadera o falsa de conseguir un trabajo y la variable independiente es calificaciones a mitad de período, calificaciones en exámenes finales y hombres o mujeres.


Si no puede ver ningún valor al trazar un histograma de sus IV, entonces tal vez no debería hacerlo, pero ¿hay algún dato que haya recopilado que cree que es de algún valor para el trabajo que está presentando? ¿el informe?
Ian_Fin

Hola Ian, he agregado más detalles sobre mi problema. Soy bastante nuevo en las estadísticas y me preguntaba si hay un enfoque general que adoptemos antes de llevar a cabo la regresión logística.
user3223190

Sugiero también mirar y posiblemente incluir varios gráficos de los datos. Por ejemplo, puede graficar la calificación final frente a la calificación de medio término codificada por colores por género y codificada por símbolos por "consiguió trabajo" y "no pudo obtener trabajo".
Emil M Friedman

Respuestas:


42

En mi campo, la parte descriptiva del informe es extremadamente importante porque establece el contexto para la generalización de los resultados. Por ejemplo, un investigador desea identificar los predictores de lesión cerebral traumática después de accidentes de motocicleta en una muestra de un hospital. Su variable dependiente es binaria y tenía una serie de variables independientes. La regresión logística multivariable le permitió producir los siguientes hallazgos:

  • sin uso de casco ajustado OR = 4.5 (IC 95% 3.6, 5.5) en comparación con el uso de casco.
  • todas las demás variables no se incluyeron en el modelo final.

Para ser claros, no hubo problemas con el modelado. Nos centramos en el valor que pueden agregar las estadísticas descriptivas.

Sin las estadísticas descriptivas, un lector no puede poner estos hallazgos en perspectiva. ¿Por qué? Déjame mostrarte las estadísticas descriptivas:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Puedes ver por lo anterior que su muestra consistía en hombres mayores e intoxicados. Con esta información, el lector puede decir qué, si es que hay alguno, estos resultados pueden decir sobre lesiones en varones jóvenes o lesiones en jinetes no intoxicados o en jinetes femeninos.

Por favor, no ignore las estadísticas descriptivas.


55
Buen ejemplo ¿Es real o inventado?
ameba dice Reinstate Monica

55
Gracias @amoeba. Los números y las estadísticas son reales. Sin embargo, cambié el tema a una lesión cerebral traumática para proteger a los inocentes.

3
Entonces, hombres borrachos que manejan motocicletas sin cascos ... ¿Quién hubiera pensado que podría terminar con una lesión cerebral traumática?
gung - Restablece a Monica

Disfruté un vaso de buen rojo australiano en ese momento y Bob es tu tío ...

25

El punto de proporcionar estadísticas descriptivas es caracterizar su muestra para que las personas en otros centros o países puedan evaluar si sus resultados se generalizan a su situación. Entonces, en su caso, tabular el sexo, las calificaciones, etc., sería una adición beneficiosa a la regresión logística. No es para permitir que las personas verifiquen sus supuestos, aunque pueden intentar hacerlo también.

============== Editar para dar enlaces a algunas pautas utilizadas en salud

En el campo con el que estoy familiarizado, salud, existen pautas específicas para informar. Estos se han recopilado en la red EQUATOR, que se debe consultar para obtener detalles actualizados.

Como ejemplo, podemos tomar ensayos clínicos donde la directriz relevante es CONSORT. En el documento que describe la guía disponible aquí y en otros lugares , leemos en la Tabla 1, recomendación 15 "Una tabla que muestra las características clínicas y demográficas de referencia para cada grupo".

Hay recomendaciones similares para otros tipos de estudio.


Gracias mdewey, así que cuando hacemos los diversos argumentos descriptivos y si notamos normalidad o asimetría, ¿por qué solo comentarlo? Básicamente, las estadísticas descriptivas solo sirven para informar al lector de qué datos está trabajando. Realmente lo siento si esto puede parecer elemental
user3223190

Así es como funciona en el campo de la salud, que es con el que estoy más familiarizado.
mdewey

8
+1. Al principio leí mal "en otros centros o países" como "en otros siglos".
ameba dice Reinstate Monica

4

Otra cosa es mostrar qué tan bien se comportan sus variables. Si, por ejemplo, una de sus variables es el salario, y ha entrevistado exactamente a un multimillonario, cuando ingresa su salario en la regresión logística va a dominar todo lo demás, por lo que probablemente aprenderá a ignorar el salario, independientemente de cuánta información real puede contener.

Algunos métodos son más sensibles que otros a la asimetría y los valores extremos, y la regresión logística es bastante sensible. Por supuesto, la prueba final está en el budín, y puede comparar los resultados obtenidos con los datos sin procesar, o con cada característica transformada hacia la normalidad.


1

Una parte descriptiva ayuda a entender al lector su conjunto de datos. En la economía aplicada, generalmente es muy recomendable, ya que puede mostrar las primeras fallas potenciales en su análisis.

Puede usar datos de diferentes fuentes para hacer explotar sus descriptivos.

1 mesa debería ser suficiente. El que adjuntaste no es muy intuitivo.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.