Si 900 de cada 1000 personas dicen que un automóvil es azul, ¿cuál es la probabilidad de que sea azul?


114

Inicialmente, esto surgió en relación con el trabajo que estamos haciendo con un modelo para clasificar el texto natural, pero lo he simplificado ... Quizás demasiado.

Tienes un auto azul (por alguna medida científica objetiva, es azul).

Se lo muestras a 1000 personas.

900 dicen que es azul. 100 no lo hacen.

Usted le da esta información a alguien que no puede ver el automóvil. Todo lo que saben es que 900 personas dijeron que era azul y 100 no. No sabes nada más sobre estas personas (las 1000).

En base a esto, le preguntas a la persona: "¿Cuál es la probabilidad de que el auto sea azul?"

¡Esto ha causado una gran divergencia de opiniones entre los que he preguntado! ¿Cuál es la respuesta correcta, si hay una?


162
Me pregunto cuáles serían las respuestas si cambiaras el auto por el vestido .
user1717828

13
Entonces, ¿cuál es la pregunta para la gente? "¿El auto es azul?" o "¿De qué color es el auto?"
kon psych

13
¿Qué significa que el auto sea azul? Si algunas personas dicen que el automóvil no es azul, entonces es probable que sea un color que algunas personas llaman azul y otras llaman por un nombre diferente. Esto no significa que no estén de acuerdo con el color, significa que no están de acuerdo con el nombre del color.
Ben

77
Creo que la pregunta mejoraría mucho si tuvieras las diferentes opiniones divergentes que encontraste. Tal como está ahora, las respuestas pueden explorar todo el campo, desde la teoría de la probabilidad hasta la teoría del color o incluso la biología (daltonismo), y no veo cómo eso realmente podría ayudarlo.
AnoE

32
Falta algo en la descripción del problema. 100 personas niegan que el automóvil sea azul cuando ciertamente es azul, hay muchas personas, no puedes simplemente descartarlas como errores aleatorios.
Aksakal

Respuestas:


117

TL; DR: A menos que asuma que las personas son irrazonablemente malas para juzgar el color del automóvil, o que los automóviles azules son irrazonablemente raros, la gran cantidad de personas en su ejemplo significa que la probabilidad de que el automóvil sea azul es básicamente del 100%.

Matthew Drury ya dio la respuesta correcta, pero me gustaría agregar a eso con algunos ejemplos numéricos, porque elegiste tus números de modo que realmente obtengas respuestas bastante similares para una amplia gama de configuraciones de parámetros diferentes. Por ejemplo, supongamos, como dijiste en uno de tus comentarios, que la probabilidad de que las personas juzguen correctamente el color de un automóvil es 0.9. Es decir: y también p ( digamos que no es azul | el automóvil no es azul ) = 0.9

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Una vez definido eso, lo que tenemos que decidir es: ¿cuál es la probabilidad previa de que el automóvil sea azul? Elija una probabilidad muy baja solo para ver qué sucede y digamos que , es decir, solo el 0.1% de todos los autos son azules. Entonces, la probabilidad posterior de que el automóvil sea azul se puede calcular como:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

Si observa el denominador, está bastante claro que el segundo término en esa suma será insignificante, ya que el tamaño relativo de los términos en la suma está dominado por la relación de a 0.1 900 , que es del orden de 10 58 . Y, de hecho, si hace este cálculo en una computadora (teniendo cuidado de evitar problemas de flujo inferior numérico) obtendrá una respuesta igual a 1 (dentro de la precisión de la máquina).0.99000.19001058

La razón por la cual las probabilidades anteriores realmente no importan mucho aquí es porque tienes mucha evidencia de una posibilidad (el auto es azul) versus otra. Esto se puede cuantificar por la razón de probabilidad , que podemos calcular como:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

Entonces, incluso antes de considerar las probabilidades anteriores, la evidencia sugiere que una opción ya es astronómicamente más probable que la otra, y para que la anterior haga alguna diferencia, los autos azules tendrían que ser irrazonablemente, estúpidamente raros (tan raros que esperaríamos encuentra 0 autos azules en la tierra).

Entonces, ¿qué pasa si cambiamos la precisión de las personas en sus descripciones del color del automóvil? Por supuesto, podríamos llevar esto al extremo y decir que lo hacen bien solo el 50% del tiempo, lo cual no es mejor que lanzar una moneda. En este caso, la probabilidad posterior de que el automóvil sea azul es simplemente igual a la probabilidad anterior, porque las respuestas de la gente no nos dijeron nada. Pero seguramente las personas lo hacen al menos un poco mejor que eso, e incluso si decimos que las personas son precisas solo el 51% del tiempo, la razón de probabilidad aún funciona de tal manera que es aproximadamente veces más probable que el automóvil sea azul .1013

Todo esto es el resultado de los números bastante grandes que eligió en su ejemplo. Si hubieran sido 9/10 personas diciendo que el auto era azul, habría sido una historia muy diferente, a pesar de que la misma proporción de personas estaba en un campamento versus el otro. Porque la evidencia estadística no depende de esta relación, sino más bien de la diferencia numérica entre las facciones opuestas. De hecho, en la razón de probabilidad (que cuantifica la evidencia), las 100 personas que dicen que el automóvil no es azul cancelan exactamente 100 de las 900 personas que dicen que es azul, por lo que es lo mismo que si 800 personas estuvieran de acuerdo era azul Y eso es obviamente una evidencia bastante clara.

(Editar: como Silverfish señaló , las suposiciones que hice aquí en realidad implicaban que cada vez que una persona describe incorrectamente un automóvil que no es azul, por defecto dice que es azul. Esto no es realista, por supuesto, porque realmente podría decir cualquier color , y diré azul solo algunas veces. Sin embargo, esto no hace ninguna diferencia en las conclusiones, ya que cuanto menos probable es que las personas confundan un automóvil que no es azul con uno azul, mayor es la evidencia de que es azul cuando lo dicen Es así que, en todo caso, los números dados anteriormente son en realidad solo un límite inferior en la evidencia pro-azul).


11
+1. De hecho, dados los datos de OP, la estimación de MLE de la frecuencia con la que las personas son precisas es 900/1000 = 90%.
ameba

55
Obtener el color correcto de un automóvil el 50% del tiempo no es lo mismo que lanzar una moneda. Después de todo, hay mucho más que solo dos colores disponibles. Además, ¿tal vez algunos digan "azul marino" o "azul" en lugar de "azul"? En realidad, las personas mayas dirán erróneamente "azul" cuando la respuesta correcta sería "un color patentado elegante y de moda que casi parece azul"
Hagen von Eitzen

10
Sé que estas son solo figuras ilustrativas, pero si "la probabilidad de que las personas juzguen correctamente el color de un automóvil es 0.9", a menos que haya algo especial sobre el color azul, no creo que sea razonable reclamar p (digamos es azul | el coche no es azul) = 0.1. Si pensamos que el 90% de las veces, las personas identifican el color correcto, entonces p (digamos rojo | el auto es rojo) = p (digamos blanco | el auto es blanco) = p (digamos verde | el auto es verde) = 0.9 y así encendido para todos los colores posibles del automóvil. Pero, ¿por qué p (digamos que azul | auto es rojo) = p (digamos azul | auto es blanco) = p (digamos azul | auto es verde) = 0.1? Esto implicaría, por ejemplo, p (digamos que blanco | auto es rojo) = 0.
Silverfish

2
@PatMolloy: no necesariamente. Depende de si las probabilidades son simétricas: ¿es igualmente probable que alguien confunda un azul con un auto no azul, como si alguien confunde un azul con un auto azul? Si es así, entonces un veredicto 500/500 da exactamente tanta información como un lanzamiento de moneda. Pero si es menos probable que las personas digan que un automóvil que no es azul es azul, que decir que un automóvil azul no es azul, entonces los 500 dichos azules son más difíciles de explicar que los 500 que no son azules, bajo el hipótesis no azul. Entonces, en ese caso, el balance de evidencia se inclinaría hacia el azul.
Ruben van Bergen

3
La percepción del color es algo complicado ... si nueve de cada diez personas dicen que un vestido es blanco y dorado, ¿cuál es la probabilidad de que sea azul y negro?
Glen_b

73

La respuesta correcta depende de la información no especificada en el problema, tendrá que hacer algunas suposiciones más para derivar una respuesta única y definitiva:

  • La probabilidad previa de que el automóvil sea azul, es decir, su creencia de que el automóvil es azul dado que aún no le ha preguntado a nadie.
  • La probabilidad de que alguien le diga que el auto es azul cuando en realidad es azul, y la probabilidad de que le diga que el auto es azul cuando en realidad no es azul.
  • La probabilidad de que el automóvil sea realmente azul cuando alguien dice que sí, y la probabilidad de que el automóvil no sea azul, cuando alguien dice que es azul.

Con estos datos, podemos desglosar todo con la fórmula de Bayes para obtener una probabilidad posterior de que el automóvil sea azul. Me centraré en el caso en el que solo le preguntamos a una persona, pero el mismo razonamiento se puede aplicar al caso en el que usted pregunta a personas.1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

Necesitamos continuar desglosando aún más , aquí es donde entra lo anterior:P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

Entonces, dos aplicaciones de la regla de Bayes lo llevan allí. Deberá determinar los parámetros no especificados en función de la información que tenga sobre la situación específica o de hacer algunas suposiciones razonables.

Hay algunas otras combinaciones de los supuestos que puede hacer, en función de:

PAGS(decir es azulel auto es azul)PAGS(el auto es azul)=PAGS(el auto es azuldecir es azul)PAGS(decir es azul)

Al principio, no sabes ninguna de estas cosas. Por lo tanto, debe hacer algunas suposiciones razonables sobre tres de ellas, y luego la cuarta se determina a partir de ahí.


55
Ese es a menudo el caso. Entonces tiene dos opciones: exprese su total falta de conocimiento asumiendo que el azul y no el azul son igualmente probables. Haga una encuesta rápida del campo, algo como esto puede ayudar: en.wikipedia.org/wiki/Car_colour_popularity
Matthew Drury

18
@Matthew el problema con "azul y no azul es igualmente probable" es que no es consistente; Si aplicamos el mismo razonamiento a cada uno de los colores posibles del automóvil, terminamos con la afirmación de que todos tienen un 50% de posibilidades (imposible con más de dos colores según las leyes de probabilidad) y menos del 50% de posibilidades (cuando usted mira el azul en "no blanco" y "no rojo", lo que también lleva a contradicciones ya que la probabilidad de cualquier color no puede tomar múltiples valores)
Glen_b

2
Hay más información no especificada que esta porque la respuesta de la gente no necesita ser independiente (de hecho, esperamos que estén fuertemente correlacionados con el color objetivo, por lo tanto, lejos de ser independientes). ¿Qué pasa si las respuestas son "demasiado" dependientes? Digamos, simplemente preguntamos a diez peatones al azar, ¿pero cada uno de ellos responde 100 veces?
Hagen von Eitzen

2
PAGS(Joe y Mary dicen azulEl |el auto es azul)=PAGS(Joe dice azulEl |el auto es azul)PAGS(María dice azulEl |el auto es azul)

15
@Glen_b: solo hay dos colores en el mundo, azul y no azul. Es cierto que ambos vienen en una variedad de tonos, especialmente no azul.
psmears

13

Hay una suposición importante de que sus 1000 opiniones no comparten un sesgo sistemático. Lo cual es una suposición razonable aquí, pero podría ser importante en otros casos.

Los ejemplos pueden ser:

  • todos comparten un daltonismo similar (genética en una población, por ejemplo),
  • todos vieron el auto en la noche bajo alumbrado público de sodio naranja,
  • todos comparten una cultura común en la que el azul es tabú o está asociado mágicamente (lo que sesga si describen o no cualquier objeto como azul o usan un eufemismo cultural o lo que sea),
  • Se les ha dicho a todos (o comparten una creencia común) que si responden / no responden de alguna manera específica, les sucederá algo bueno / malo .....

No es probable en este caso, pero es una suposición implícita significativa en otros casos. Tampoco tiene que ser tan extremo: transponga su pregunta a otro dominio y esto será un factor real.

Ejemplos para cada uno donde su respuesta puede verse afectada por un sesgo compartido:

  • pregunte si un vaso alto y delgado contiene más que un vaso gordo corto realmente idéntico, pero sus 1000 encuestados son niños muy pequeños (percepción errónea compartida).
  • Preguntar a 1000 personas si caminar debajo de una escalera es peligroso (creencia cultural común)
  • Pregunte a 1000 personas casadas si aman a su pareja / han tenido una aventura, en circunstancias en las que creen que su pareja sabrá su respuesta. El contexto puede ser un programa de televisión o un compañero presente cuando se le pregunta, etc.

No sería difícil imaginar algunas preguntas estructuralmente idénticas donde la respuesta 900: 100 fue una medida de creencias y honestidad, o algo más, y no apunta a la respuesta correcta. No es probable en este caso, pero en otros casos, sí.


11

Una razón por la que obtiene diferentes respuestas de diferentes personas es que la pregunta se puede interpretar de diferentes maneras, y no está claro qué quiere decir con "probabilidad" aquí. Una forma de dar sentido a la pregunta es asignar antecedentes y razones usando la regla de Bayes como en la respuesta de Matthew.

Antes de pedir probabilidades, debe decidir qué se modela como aleatorio y qué no. No se acepta universalmente que se asignen cantidades desconocidas pero fijas antes. Aquí hay un experimento similar al suyo que resalta el problema con la pregunta:

Xyoyo=1,...,1000pags=0,5Xyoyo=11000Xyo=900

pagspags


1
Entonces, si elimina la suposición de que el automóvil es azul y el resto es el mismo, 900 personas dicen que es azul y 100 dicen que no, en ese caso la probabilidad sería 0.9.
usuario

No, está mucho más cerca de 1. Es muy, muy poco probable que 900 de cada 1000 personas obtengan el color incorrecto.
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.esto no corresponde a una comprensión de la "probabilidad", ya que estoy familiarizado con ella. Suena un poco como "X puede suceder o no puede suceder, por lo que la probabilidad debe ser del 50%". ¿Puedes aclarar un poco más lo que quieres decir con esa oración?
AnoE

2
@AnoE la distinción es análoga a la que existe entre parámetros y variables aleatorias. En el contexto de la pregunta, el automóvil es azul, su color no es el resultado de un experimento aleatorio. Es esencialmente una interpretación frecuentista v. Bayesiana. Si lanzas una moneda 1000 veces y observas 900 caras, ¿cuál es la probabilidad de que la moneda sea justa? Es uno o cero si eres un frecuentista (o sin sentido); No asignamos probabilidades a los parámetros.
ekvall

@usuario No, he actualizado la respuesta para aclarar mi punto.
ekvall

7

Respuesta práctica simple:

La probabilidad puede variar fácilmente de 0% a 100% dependiendo de sus suposiciones

Aunque realmente me gustan las respuestas existentes, en la práctica básicamente se reduce a estos dos escenarios simples:

Escenario 1: se supone que las personas son muy buenas para reconocer el azul cuando es azul ... 0%

En este caso, hay tantas personas que afirman que el automóvil no es azul, que es muy poco probable que el automóvil sea realmente azul. Por lo tanto, la probabilidad se acerca al 0%.

Escenario 2: se supone que las personas son muy buenas para reconocer no azul cuando no es azul ... 100%

En este caso, hay tantas personas que afirman que el automóvil es azul, que es muy probable que sea azul. Por lo tanto, la probabilidad se acerca al 100%.


Por supuesto, llegando a esto desde un ángulo matemático, comenzaría por algo genérico como 'supongamos que las probabilidades relevantes son ...', lo que no tiene sentido ya que tales cosas generalmente no se conocen por ninguna circunstancia aleatoria. Por lo tanto, abogo por mirar los extremos para comprender la idea de que ambos porcentajes pueden justificarse fácilmente con suposiciones simples y realistas, y que, por lo tanto, no hay una respuesta única y significativa.


2
Si "se supone que las personas son muy buenas para reconocer el azul", ¿por qué estimarían que es azul cuando no está en el escenario 1? Es posible que desee expresar sus escenarios en términos de falsas positivas y falsos negativos.
hyde

@hyde reformuló los escenarios para eliminar la ambigüedad
Dennis Jaheruddin


5

Necesita desarrollar un marco de estimación. Algunas preguntas que puede hacer son

  1. Cuantos colores hay? ¿Estamos hablando de dos colores? O todos los colores del arcoiris?

  2. ¿Qué tan distintos son los colores? ¿Estamos hablando de azul y naranja? ¿O azul, cian y turquesa?

  3. ¿Qué significa ser azul? ¿Son cian y / o azul turquesa? ¿O simplemente azul en sí mismo?

  4. ¿Qué tan buenas son estas personas para estimar el color? ¿Son todos diseñadores gráficos? ¿O son daltónicos?

Desde un punto de vista puramente estadístico, podemos hacer algunas conjeturas sobre el último. Primero, sabemos que al menos el 10% de las personas están eligiendo una respuesta incorrecta. Si solo hay dos colores (de la primera pregunta), entonces podríamos decir que hay

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

Como una comprobación rápida, si sumamos esos, obtenemos el 100%. Puede ver una notación más matemática de esto en la respuesta @MatthewDrury .

¿Cómo conseguimos el 90% en el tercero? Es la cantidad de personas que dijeron azul pero se equivocaron si no es así. Debido a que solo hay dos colores, estos son simétricos. Si hubiera más de dos colores, entonces la posibilidad de que la elección incorrecta fuera azul cuando decían algo más sería menor.

De todos modos, este método de estimación nos da 90% de azul. Esto incluye un 81% de posibilidades de que las personas digan azul cuando es así y un 9% de probabilidades de que las personas digan que no es así. Esto es probablemente lo más cerca que podemos llegar a responder la pregunta original, y requiere que confiemos en los datos para estimar dos cosas diferentes. Y asumir que la probabilidad de que se elija el azul es la misma que la probabilidad de que el azul sea correcto.

Si hay más de dos colores, entonces la lógica va a cambiar un poco. Las primeras dos líneas permanecen igual, pero perdemos la simetría en las últimas dos líneas. En ese caso, necesitamos más información. Es posible que podamos estimar nuevamente la probabilidad de decir correctamente el azul como 81%, pero no tenemos idea de cuáles son las posibilidades de que el color sea azul cuando alguien dice que no lo es.

También podríamos mejorar incluso la estimación de dos colores. Dado un número estadísticamente significativo de automóviles de cada color, podríamos tener un número estadísticamente significativo de personas que los vean y los clasifiquen. Luego podríamos contar con qué frecuencia las personas tienen razón cuando hacen cada elección de color y con qué frecuencia son correctas para cada elección de color. Entonces podríamos estimar con mayor precisión dadas las elecciones reales de las personas.

Puede preguntar cómo 90% podría estar equivocado. Considere lo que sucede si hay tres colores: azul, azul y zafiro. Alguien podría considerar razonablemente que estos tres son azules. Pero queremos más. Queremos el tono exacto. ¿Pero quién recuerda los nombres de los otros tonos? Muchos pueden adivinar el azul porque es el único tono coincidente que conocen. Y aún así estar equivocado cuando resulta ser azul.


Como se mencionó en uno de los comentarios anteriores, seguramente los únicos dos colores relevantes son 'azul' y 'no azul', por lo tanto, la parte sobre colores múltiples no debería ser necesaria.
Dennis Jaheruddin

4

Un exacta, matemática, verdadero / falso probabilidad no se puede calcular con la información que proporcione.

Sin embargo, en la vida real, dicha información nunca está disponible con certeza. Por lo tanto, usando nuestra intuición (y dónde iría todo mi dinero si apostamos), el auto es definitivamente azul. (algunos creen que esto ya no son estadísticas, pero bueno, las vistas en blanco y negro de la ciencia no son muy útiles)

El razonamiento es simple. Suponga que el auto no es azul. Entonces el 90% de las personas (!) Se equivocaron. Solo podrían estar equivocados debido a una lista de problemas que incluye:

  • daltonismo
  • mentira patológica
  • estar bajo la influencia de sustancias como el alcohol, LCD, etc.
  • sin entender la pregunta
  • otra forma de trastorno mental
  • Una combinación de lo anterior

Dado que lo anterior claramente no es probable que afecte al 90% de una población aleatoria promedio (por ejemplo, el daltonismo afecta a alrededor del 8% de los hombres y el 0.6% de las mujeres, es decir, 43 de cada 1000), es necesariamente el caso de que el automóvil esté azul. (Eso es donde todo mi dinero iría de todos modos).


Esto me parece intuitivamente correcto. Creo que la crítica de la pregunta original es que no proporciona suficiente información y que se deben hacer ciertas suposiciones ... bueno, ¿no es ese el caso casi siempre en el mundo real?
Pat Molloy

@PatMolloy No proporciona suficiente información para proporcionar una respuesta matemática sofisticada exacta correcta / incorrecta (que es ciertamente lo que muchas preguntas pretenden obtener de este sitio). Sin embargo, dada la información reducida que proporcionó, cuando se trata de apostar dinero, esta es la respuesta (100%) que la gente elegirá.
luchonacho

1
Creo que no ha logrado cubrir algunas de las alternativas más plausibles, que son las que deberían hacer que modifique su conclusión. Estos incluyen (a) las personas no pueden reconocer el azul; (b) no existe un entendimiento común de "azul" entre el interlocutor y los encuestados; (c) el significado "científico" de "azul" difiere de lo que la gente entiende comúnmente como "azul". Es importante destacar que, dado que no puede cuantificar ninguna de estas alternativas, ni la mayoría de las que enumera, ¿cómo puede justificar la cuantificación de la probabilidad de la respuesta? ¡Eso no es estadística!
whuber

"Dado que lo anterior claramente no es probable que afecte al 90% de una población aleatoria promedio" No esté tan seguro de eso. Recuerde que generalmente hablamos en términos de promedios cuando hablamos de humanos. Así que seguro, solo un pequeño porcentaje tiene daltonismo (en comparación con el promedio), pero puede haber unos pocos que tengan una visión superior, por ejemplo, los tetracromatos.
NPSF3000

2
Siempre estoy bajo la influencia de LCD
Alex

2

No comería heces por el hecho de que miles de millones de moscas no pueden estar equivocadas. Podría haber docenas de otras razones por las cuales 900 personas de cada 1000 podrían haber sido engañadas para pensar que el automóvil es azul. Después de todo, esa es la base de los trucos mágicos, que atraen a las personas a pensar que algo está alejado de la realidad. Si 900 de cada 1000 personas ven a un mago apuñalando a su asistente, responderán rápidamente si el asistente fue apuñalado, por lo improbable que ocurrió un homicidio en el escenario. Una luz azul en la pintura reflectante de un auto, ¿alguien?


2

El encuestado sabe muy poco acerca de cómo se realizó la encuesta para responder la pregunta con precisión. En lo que a él respecta, la encuesta puede sufrir varios problemas:

Las personas que participaron en la encuesta podrían haber sido parciales:

  1. El auto se veía azul debido a una ilusión óptica .

  2. Por alguna razón, el color del automóvil era difícil de observar, y por alguna razón a la gente se le habían mostrado muchos automóviles azules antes de este, lo que hizo que la mayoría de ellos creyeran que este automóvil probablemente también era azul.

  3. Les habías pagado para decir que el auto es azul.

  4. Hiciste que alguien los hipnotizara para que creyeran que el auto es azul.

  5. Habían hecho un pacto para mentir y sabotear la encuesta.

Puede haber habido correlaciones entre las personas que respondieron la encuesta debido a cómo fueron seleccionadas o porque se afectaron entre sí:

  1. Accidentalmente realizó la encuesta en una reunión masiva para personas con el mismo tipo de daltonismo.

  2. Realizaste la encuesta en jardines de infancia; Las chicas no estaban interesadas en el automóvil y la mayoría de los chicos tenían el azul como su color favorito, lo que les hacía imaginar que el automóvil era azul.

  3. La primera persona a quien se le mostró el auto estaba borracho y pensó que se veía azul, gritó "ES AZUL", haciendo que todos los demás pensaran que el auto era azul.

Entonces, si bien la probabilidad de que el automóvil sea azul si la encuesta se realizó de manera completamente correcta es extremadamente alta (como se explica en la respuesta de Ruben van Bergen), la confiabilidad de la encuesta puede haberse visto comprometida, lo que hace que la posibilidad de que el automóvil no sea azul no insignificante. Lo grande que el encuestado estima que esta oportunidad depende en última instancia de sus estimaciones de cuán probable es que las circunstancias se hayan equivocado con la encuesta y de qué tan bueno es para llevar a cabo encuestas (y cuán travieso cree que es).


2

¿Cuál es la definición de "azul"?

Diferentes culturas e idiomas tienen diferentes nociones de azul. IIRC, ¡algunas culturas incluyen el verde dentro de su noción de azul!

Al igual que cualquier palabra de lenguaje natural, solo puede suponer que hay alguna convención cultural sobre cuándo (y cuándo no) llamar a las cosas "azules".

En general, el color en el lenguaje es sorprendentemente subjetivo (enlace de los comentarios a continuación, gracias @Count Ibilis)

ingrese la descripción de la imagen aquí


77
En el contexto de la pregunta, creo que este aspecto en particular es bastante irrelevante: supongo que el OP eligió la palabra "azul" como un término muy genérico y no algo como "azure", "torqouise", etc., donde las personas pueden estar inseguras. Además, los automóviles suelen utilizar una paleta muy limitada de colores posibles / habituales. Por último, la pregunta no es "por qué 100 personas dijeron que no es azul", sino "qué probabilidad de que el automóvil sea realmente azul".
AnoE


Una definición precisa sería "irradia luz predominantemente con una longitud de onda de 475 nm más menos ~ 10-20 nm en las condiciones ambientales actuales". Esto generalmente se acepta como azul.
rackandboneman

Sí, pero ¿cuántas personas llevan una herramienta para medir la longitud de onda predominante? También olvidó excluir longitudes de onda no visibles.
Anony-Mousse

1
La pregunta parece ser sobre el uso de un grupo de personas de calibración desconocida estadísticamente como un medidor de longitud de onda :)
rackandboneman

1

La probabilidad podría, dependiendo de condiciones previas más refinadas, ser varios valores diferentes, pero 99.995% es el que tiene más sentido para mí.

Sabemos, por definición, que el automóvil es azul (eso es 100%), pero no está bien especificado lo que esto realmente significa (eso apostaría algo filosófico). Asumiré que algo es azul en el sentido de que puede ser visto como azul.

También sabemos que el 90% de los sujetos de prueba lo informaron como azul.

Nosotros no sabemos lo que se solicitó o cómo se realizó la evaluación, y qué condiciones de iluminación del automóvil se encontraba. Cuando se le preguntó a nombrar el color, algunos sujetos puede ser que por ejemplo han dicho "verde-azul" debido a las condiciones de iluminación, y el evaluador podría no haber contado eso como "azul". Las mismas personas podrían haber respondido "sí" si la pregunta hubiera sido "¿Es esto azul?". Asumiré que no tenía la intención de engañar maliciosamente a los sujetos de prueba.

Sabemos que la incidencia de la tritanopía es de aproximadamente el 0,005%, lo que significa que si el automóvil realmente puede verse como azul , entonces el 99,995% de los sujetos de prueba sí vieron el color como azul. Sin embargo, eso significa que el 9.995% de los sujetos de prueba no informaron azul cuando claramente vieron azul. Estaban mintiendo sobre lo que vieron. Esto está cerca de lo que su experiencia de vida también le dice: las personas no siempre son honestas (pero, a menos que haya un motivo, generalmente lo son).

Por lo tanto, la persona que no observa puede asumir con certeza abrumadora que el automóvil es azul. Eso sería 100%

Excepto ... excepto si la persona que no observa sufre de tritanopía, en cuyo caso no vería el auto como azul a pesar de que todos los demás (o más bien, el 90% de ellos) lo dicen. Aquí se vuelve filosófico otra vez: si todos los demás escucharon la caída de un árbol, pero yo no, ¿se cayó?

Me atrevo a decir que la respuesta más razonable y práctica sería: si la persona que no observa es un trianope (0.005% de probabilidad), entonces verificar si el color predicho y el color real tal como se ven serían falsos. Por lo tanto, la probabilidad es del 99.995% en lugar del 100%.

Además, como beneficio adicional, dado que descubrimos que el 9.995% de los sujetos de prueba son mentirosos, y se sabe que todos los cretenses son mentirosos , ¡podemos concluir que no estamos en Creta!


1

Tienes un auto azul (por alguna medida científica objetiva, es azul).

...

"¿Cuál es la probabilidad de que el auto sea azul?"

Es 100% azul.

Todo lo que saben es que 900 personas dijeron que era azul y 100 no. No sabes nada más sobre estas personas (las 1000).

El uso de estos números (sin ningún contexto) es completamente absurdo. Todo se reduce a la interpretación personal de la pregunta. No debemos seguir este camino y usar Wittgenstein: "Wovon man nicht sprechen kann, darüber muss man schweigen".


Imagine la siguiente pregunta para comparar:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Este es básicamente el mismo problema (sin información), pero está mucho más claro que lo que pensamos del color del automóvil es en su mayoría (si no completamente) circunstancial.


A la larga, cuando recibimos múltiples preguntas asociadas, podemos comenzar a adivinar respuestas a preguntas tan incompletas. Esto es lo mismo para el algoritmo de ojo por ojo que no funciona para un solo caso, pero funciona a largo plazo . En el mismo sentido, Wittgenstein regresó de su trabajo anterior con sus Investigaciones principales . Podemos responder estas preguntas, pero necesitamos más información / ensayos / preguntas. Es un proceso.


0

Si suponemos que el automóvil es azul, entonces 100 de cada 1,000 que dicen que no es azul implica un sesgo de muestra extremo de algún tipo. Tal vez estabas probando solo personas daltónicas. Si suponemos que el automóvil no es azul, entonces el sesgo de la muestra es aún peor. Entonces, todo lo que podemos concluir de los datos proporcionados es que la muestra es muy sesgada, y dado que no sabemos cómo fue sesgada, no podemos concluir nada sobre el color del automóvil.


Umm, ¿seguramente el hecho de que 900 personas dijeron que era azul es bueno para algo? ¿No podemos concluir que es más probable que sea azul que no? Recuerde que el encuestado solo conoce los números 900 y 100. Entonces, ¿pueden realmente decir algo sobre el sesgo?
Pat Molloy

0

Ha habido algunas respuestas. De ninguna manera soy un gurú de las matemáticas, pero bueno, aquí está el mío.

Solo puede haber 4 posibilidades:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

De la pregunta, usted sabe que la suma del caso 1 y el caso 4 es de 900 personas (90%), y la suma del caso 2 y el caso 3 es de 100 personas (10%). Sin embargo, aquí está el truco: lo que no sabe es la distribución dentro de estos 2 pares de casos. Tal vez la suma de los casos 1 y 4 esté completamente compuesta por el caso 1 (lo que significa que el automóvil es azul), o tal vez la suma total esté compuesta por el caso 4 (lo que significa que el automóvil no es azul). Lo mismo ocurre con la suma del caso 2 + 3. Entonces ... Lo que necesita es encontrar alguna forma de predecir la distribución dentro de las sumas de casos. Sin ninguna otra indicación en la pregunta (en ninguna parte dice que las personas están 80% seguras de saber sus colores o algo así) no hay forma de que pueda dar una respuesta segura y definitiva.

Dicho esto ... sospecho que la respuesta esperada es algo similar a:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

donde el 50% restante es simplemente desconocido, llámelo margen de error.


0

X,Y1,Y2,...,Y1000{0 0,1}1pags(X)pagsXYyoEl |X=1pags1YyoEl |X=0 0pags0 0θ=(pagsX,pags0 0,pags1)

pags(θ,XEl |y1:1000)pags(θ)pags(XEl |θ)yo=11000pags(yyoEl |X)

{Xyo}{yyoEl |X}


-3

La persona que no puede ver el automóvil no sabe que está científicamente comprobado que es azul. La probabilidad de que el auto sea azul es 50/50 (es azul o no lo es). Las encuestas a otras personas pueden influir en la opinión de esta persona, pero no cambia la probabilidad de que un automóvil invisible sea azul o no.

Todas las matemáticas anteriores determinan la probabilidad de que su conjunto de muestras pueda determinar si es azul.


No estoy seguro de que sea cierto que la probabilidad de que sea azul sea 50/50. De hecho, es mucho menos de 50, ya que podría ser rojo, blanco, amarillo, etc. La probabilidad de que un automóvil recogido al azar sea azul es muy inferior al 50%.
usuario
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.