¿Es el resultado de un examen un binomio?


31

Aquí hay una simple pregunta estadística que me dieron. No estoy realmente seguro de entenderlo.

X = el número de puntos adquiridos en un examen (opción múltiple y una respuesta correcta es un punto). ¿Se distribuye X binomial?

La respuesta del profesor fue:

Sí, porque solo hay respuestas correctas o incorrectas.

Mi respuesta:

No, porque cada pregunta tiene una "probabilidad de éxito" diferente p. Como entendí, una distribución binomial es solo una serie de experimentos de Bernoulli, cada uno de los cuales tiene un resultado simple (éxito o fracaso) con una probabilidad de éxito dada p (y todos son "idénticos" con respecto a p). Por ejemplo, lanzar una moneda (regular) 100 veces, esto es 100 experimentos de Bernoulli y todos tienen p = 0.5. Pero aquí las preguntas tienen diferentes tipos de p ¿verdad?


14
+1 Aún más al punto: a menos que este sea un examen extraño, las respuestas a las preguntas estarán fuertemente correlacionadas. Si es el puntaje total para un individuo, esto impedirá una distribución binomial. ¿Podría ser posible que la pregunta esté operando bajo un supuesto de "hipótesis nula" en el que todos los examinados adivinan de forma independiente y aleatoria todas las respuestas? X
whuber

2
Qué paradójico, habría presionado al menos para obtener un crédito parcial sobre esto, pero la "respuesta" parece reflejar una inclinación a otorgarla :) (Creo que estás aquí).
AdamO

1
Sí, gracias: D, creo que es más una distribución binomial de Poisson (en todo caso)
Paul


2
Estoy de acuerdo con todos en que la pregunta era pobre, pero aquí hay un problema de elaboración. Si este es un curso de primaria y es un formato de respuesta corta (para que tenga la oportunidad de explicar su razonamiento), diría que la mejor respuesta es probablemente "sí (suponiendo independencia e igual dificultad para cada pregunta)"; eso le indicaría al profesor que (1) usted comprende las limitaciones de la pregunta y (2) no está tratando de ser un imbécil.
Ben Bolker

Respuestas:


25

Estoy de acuerdo con tu respuesta. Por lo general, este tipo de datos hoy en día se modelaría con algún tipo de modelo de Teoría de respuesta al elemento . Por ejemplo, si utilizó el modelo Rasch , entonces la respuesta binaria se modelaría comoXni

Pr{Xni=1}=eβnδi1+eβnδi

donde puede ser pensado como personas -ésimos capacidad y como -ésima pregunta dificultad. Entonces, el modelo le permite comprender el hecho de que diferentes personas varían en habilidades y las preguntas varían en dificultad, y este es el más simple de los modelos IRT.βnnδii

La respuesta de sus profesores supone que todas las preguntas tienen la misma probabilidad de "éxito" y son independientes, ya que binomial es una distribución de una suma de ensayo de Bernoulli. Ignora los dos tipos de dependencias descritas anteriormente.n

Como se observó en los comentarios, si observaba la distribución de respuestas de una persona en particular (por lo que no tiene que preocuparse por la variabilidad entre personas) o las respuestas de diferentes personas en el mismo elemento (por lo que no hay variabilidad del ítem), entonces la distribución sería Poisson-binomial, es decir, la distribución de la suma de ensayos de Bernoulli no iid. La distribución podría ser aproximada con binomial o Poisson, pero eso es todo. De lo contrario, está asumiendo el iid.n

Incluso bajo el supuesto "nulo" de adivinar, esto supone que no hay patrones de adivinanzas, por lo que las personas no difieren en cómo adivinan y los elementos no difieren en cómo se adivinan, por lo que la suposición es puramente aleatoria.


¡Eso tiene sentido! Aunque supongo que podría calcular la probabilidad de éxito de una pregunta, pero la "habilidad de las personas" parece difícil :) Otra idea que tuve es modelar esto como una suma de distribuciones de bernulli. Por ejemplo, digamos que hay 2 preguntas, por lo tanto, 2 probabilidades de éxito p1 y p2. Análogamente, dos variables X1 y X2 cuentan (2 experimentos bernulli). Entonces, por ejemplo, la probabilidad de obtener una puntuación total de 1 es P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) p2. ¿Suena razonable?
Paul

2
@Paul suma de dos Bernoulli con diferentes p's es Poisson-binomial
Tim

44
La suposición "nula" es básicamente una cuestión de vaca esférica, siempre se puede objetar exactamente qué tan esférica es la vaca.
Hong Ooi

5

La respuesta a este problema depende de la formulación de la pregunta y de cuándo se obtiene la información. En general, tiendo a estar de acuerdo con el profesor, pero creo que la explicación de su respuesta es deficiente y la pregunta del profesor debería incluir más información por adelantado.

Si considera un número infinito de posibles preguntas del examen, y saca una al azar para la pregunta 1, dibuje una al azar para la pregunta 2, etc. Luego, vaya al examen:

  1. Cada pregunta tiene dos resultados (correcto o incorrecto)
  2. Hay un número fijo de ensayos (preguntas)
  3. Cada ensayo podría considerarse independiente (al entrar en la pregunta dos, su probabilidad de hacerlo bien es la misma que cuando entra en la pregunta uno)p

Bajo este marco, se cumplen los supuestos de un experimento binomial.

Por desgracia, los problemas estadísticos mal propuestos son muy comunes en la práctica, no solo en los exámenes. No dudaría en defender su justificación ante su profesor.


Jea, supongo que eso también está bien. La pregunta es simplemente "mala", ya que podría argumentar en ambos sentidos, ya que se da muy poca información. Pero estaba muy descontento con la respuesta dada de mi profesor.
Paul

44
@Paul, en realidad es bastante difícil escribir buenas preguntas estadísticas. Sé que lo he volcado en muchas ocasiones.
gung - Restablece a Monica

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Creo que debe hacer explícito el supuesto de que las preguntas del examen se extraen independientemente del conjunto de preguntas potenciales. Sería más realista que estuvieran correlacionados: si la pregunta 1 es fácil, es probable que le den un examen fácil y que la pregunta 2 lo sea.
Adrian

0

Si hay n preguntas, y puedo responder cualquier pregunta correctamente con probabilidad p, y hay tiempo suficiente para intentar responder todas las preguntas, e hice 100 de estas pruebas, entonces mis puntajes serían distribuidos normalmente con una media de np.

Pero no soy yo repitiendo la prueba 100 veces, son 100 candidatos diferentes haciendo una prueba, cada uno con su propia probabilidad p. La distribución de estos p será el factor primordial. Es posible que tenga una prueba donde p = 0.9 si estudió bien el tema, p = 0.1 si no lo hizo, con muy pocas personas entre 0.1 y 0.9. La distribución de puntos tendrá máximos muy fuertes en 0.1n y 0.9 ny no estará cerca de la distribución normal.

Por otro lado, hay pruebas en las que todos pueden responder cualquier pregunta, pero toman diferentes cantidades de tiempo, por lo que algunos responderán todas las preguntas n, y otros responderán menos porque se les acaba el tiempo. Si podemos suponer que la velocidad de los candidatos está distribuida normalmente, entonces los puntos estarán cerca de la distribución normal.

Pero muchas pruebas contendrán algunas preguntas muy difíciles y otras muy fáciles, intencionalmente para que podamos distinguir entre los mejores candidatos (que responderán todas las preguntas hasta cierto grado de dificultad) y los peores candidatos (que solo podrán responder muy bien). preguntas simples). Esto cambiaría la distribución de puntos con bastante fuerza.


2
La distribución normal que describe aquí es la aproximación normal del binomio. Obviamente, la suma de ceros y unos no sería continua y oscilaría entre y
Tim

2
@Tim A pesar de la dependencia innecesaria de las distribuciones normales y el misterio de tomar 100 pruebas, esta respuesta tiene mérito al intentar demostrar cómo un caso particular puede conducir a una distribución obviamente no binomial. Como tal, podría ser una valiosa contribución a las respuestas si se abordaran estos problemas técnicos.
whuber

0

Por definición, una distribución binomial es un conjunto de ensayos de Bernoulli independientes e idénticamente distribuidos . En el caso de un examen de opción múltiple, cada una de las preguntas sería uno de los ensayos de Bernoulli.n n

El problema aquí surge porque no podemos asumir razonablemente que las preguntas:n

  • Están idénticamente distribuidos . Como dijiste, la probabilidad de que un estudiante sepa la respuesta a la pregunta seguramente no será la misma que la probabilidad de que sepa la respuesta a la pregunta , y así sucesivamente.12
  • Son independientes . Muchos exámenes hacen preguntas que se basan en las respuestas a las preguntas anteriores. ¿Quién puede decir con certeza que eso no sucedería en el examen en esta pregunta? Hay otros factores que podrían hacer que las respuestas a las preguntas del examen no sean independientes entre sí, pero creo que este es el más intuitivo.

He visto preguntas en las clases de Estadística que modelan las preguntas del examen como binomios, pero están enmarcadas de la siguiente manera:

¿Qué distribución de probabilidad modelaría el número de preguntas respondidas correctamente en un examen de opción múltiple donde cada pregunta tiene cuatro opciones, y el estudiante que toma el examen está adivinando cada respuesta al azar?

En este escenario, por supuesto, se representaría como una distribución binomial con .p=14


No pasa nada con sus hechos, pero la lógica es incorrecta: no es suficiente demostrar que algunos supuestos pueden no ser válidos, porque (lógicamente) la distribución podría ser binomial en cualquier caso. También debe demostrar que estas suposiciones pueden fallar de manera que la distribución de puntaje definitivamente no sea binomial.
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.