Permítame devolverle una pregunta: ¿Cuál es la velocidad de bits y la profundidad de bits de un disco de vinilo?
Las cámaras son dispositivos diseñados para, lo más fielmente posible, reproducir la imagen proyectada en su CCD. Un ojo humano es un dispositivo evolucionado cuyo propósito es simplemente mejorar la supervivencia. Es bastante complejo y a menudo se comporta de manera contra intuitiva. Tienen muy pocas similitudes:
- Una estructura óptica para enfocar la luz.
- Una membrana receptiva para detectar la luz proyectada.
Los fotorreceptores de la retina.
El ojo en sí no es notable. Tenemos millones de fotorreceptores, pero proporcionan entradas redundantes (¡y ambiguas al mismo tiempo!) A nuestro cerebro. Los fotorreceptores de barra son muy sensibles a la luz (especialmente en el lado azulado del espectro) y pueden detectar un solo fotón. En la oscuridad, funcionan bastante bien en un modo llamado visión escotópica. A medida que se vuelve más brillante, como durante el crepúsculo, las células cónicas comienzan a despertarse. Las células de cono requieren alrededor de 100 fotones como mínimo para detectar la luz. Con este brillo, tanto las células de barra como las células de cono están activas, en un modo llamado visión mesópica. Las celdas de barra proporcionan una pequeña cantidad de información de color en este momento. A medida que se vuelve más brillante, las células de barra se saturan y ya no pueden funcionar como detectores de luz. Esto se llama visión fotópica, y solo funcionarán las células cónicas.
Los materiales biológicos son sorprendentemente reflexivos. Si no se hizo nada, la luz que pasa a través de nuestros fotorreceptores y golpea la parte posterior del ojo se reflejaría en ángulo, creando una imagen distorsionada. Esto se resuelve mediante la capa final de células en la retina que absorbe la luz usando melanina. En los animales que requieren una gran visión nocturna, esta capa es intencionalmente reflectante, por lo que los fotones que pierden fotorreceptores tienen la oportunidad de golpearlos en su camino de regreso. ¡Es por eso que los gatos tienen retinas reflectantes!
Otra diferencia entre una cámara y el ojo es dónde están ubicados los sensores. En una cámara, se ubican inmediatamente en el camino de la luz. A los ojos, todo está al revés. El circuito retiniano se encuentra entre la luz y los fotorreceptores, por lo que los fotones deben pasar a través de una capa de todo tipo de células y vasos sanguíneos, antes de finalmente golpear una barra o cono. Esto puede distorsionar la luz ligeramente. Afortunadamente, nuestros ojos se calibran automáticamente, por lo que no estamos atrapados mirando a un mundo con vasos sanguíneos rojos brillantes que fluyen de un lado a otro.
El centro del ojo es donde tiene lugar toda la recepción de alta resolución, con la periferia cada vez menos sensible al detalle y más daltónico (aunque más sensible a pequeñas cantidades de luz y movimiento). Nuestro cerebro se ocupa de esto moviendo rápidamente nuestros ojos en un patrón muy sofisticado que nos permite obtener el máximo detalle del mundo. Una cámara es realmente similar, pero en lugar de usar un músculo, toma muestras de cada receptor CCD a su vez en un patrón de exploración rápida. Este escaneo es mucho, mucho más rápido que nuestro movimiento sacádico, pero también está limitado a solo un píxel a la vez. El ojo humano es más lento (y el escaneo no es progresivo y exhaustivo), pero puede abarcar mucho más a la vez.
Preprocesamiento realizado en la retina.
La retina en sí misma hace bastante preprocesamiento. El diseño físico de las celdas está diseñado para procesar y extraer la información más relevante.
Si bien cada píxel en una cámara tiene un mapeo 1: 1 del píxel digital que se está almacenando (al menos para una imagen sin pérdida), los bastones y conos en nuestra retina se comportan de manera diferente. Un solo "píxel" es en realidad un anillo de fotorreceptores llamado campo receptivo. Para comprender esto, se requiere una comprensión básica de los circuitos de la retina:
Los componentes principales son los fotorreceptores, cada uno de los cuales se conecta a una sola célula bipolar, que a su vez se conecta a un ganglio que llega a través del nervio óptico al cerebro. Una célula ganglionar recibe información de múltiples células bipolares, en un anillo llamado campo receptivo de centro-envolvente. El centro si el anillo y el borde del anillo se comportan como opuestos. La luz que activa el centro excita la célula ganglionar, mientras que la luz que activa el entorno lo inhibe (un campo en el centro, fuera del entorno). También hay células ganglionares para las cuales esto se invierte (descentrado, en envolvente).
Esta técnica mejora notablemente la detección de bordes y el contraste, sacrificando la agudeza en el proceso. Sin embargo, la superposición entre los campos receptivos (un solo fotorreceptor puede actuar como entrada a múltiples células ganglionares) le permite al cerebro extrapolar lo que está viendo. Esto significa que la información que se dirige al cerebro ya está altamente codificada, hasta el punto en que una interfaz cerebro-computadora que se conecta directamente al nervio óptico no puede producir nada que podamos reconocer. Se codifica de esta manera porque, como otros han mencionado, nuestro cerebro proporciona increíbles capacidades de procesamiento posterior. Como esto no está directamente relacionado con el ojo, no profundizaré mucho en ellos. Lo básico es que el cerebro detecta líneas individuales (bordes), luego sus longitudes, luego su dirección de movimiento, cada una en áreas subsecuentemente más profundas de la corteza,flujo ventral y flujo dorsal , que sirven para procesar color y movimiento de alta resolución, respectivamente.
La fóvea central es el centro del ojo y, como otros han señalado, es de donde proviene la mayor parte de nuestra agudeza. Contiene solo células cónicas y, a diferencia del resto de la retina, tiene un mapeo 1: 1 de lo que vemos. Un fotorreceptor de cono único se conecta a una célula bipolar única que se conecta a una célula ganglionar única.
Las especificaciones del ojo
El ojo no está diseñado para ser una cámara, por lo que no hay forma de responder muchas de estas preguntas de la manera que desee.
¿Cuál es la resolución efectiva?
En una cámara, hay una precisión bastante uniforme. La periferia es tan buena como el centro, por lo que tiene sentido medir una cámara por la resolución absoluta. El ojo, por otro lado, no solo no es un rectángulo, sino que diferentes partes del ojo ven con diferente precisión. En lugar de medir la resolución, los ojos se miden con mayor frecuencia en VA . Un VA 20/20 es promedio. Un VA 20/200 te hace legalmente ciego. Otra medida es LogMAR , pero es menos común.
¿Campo de visión?
Al tener en cuenta ambos ojos, tenemos un campo de visión horizontal de 210 grados y un campo de visión vertical de 150 grados. 115 grados en el plano horizontal son capaces de visión binocular. Sin embargo, solo 6 grados nos proporciona una visión de alta resolución.
Apertura máxima (y mínima)?
Típicamente, la pupila tiene 4 mm de diámetro. Su rango máximo es de 2 mm ( f / 8.3 ) a 8 mm ( f / 2.1 ). A diferencia de una cámara, no podemos controlar manualmente la apertura para ajustar cosas como la exposición. Un pequeño ganglio detrás del ojo, el ganglio ciliar, ajusta automáticamente la pupila según la luz ambiental.
Equivalencia ISO?
No puede medir esto directamente, ya que tenemos dos tipos de fotorreceptores, cada uno con una sensibilidad diferente. Como mínimo, podemos detectar un solo fotón (aunque eso no garantiza que un fotón que golpee nuestra retina golpee una célula de barra). Además, no ganamos nada mirando algo durante 10 segundos, por lo que la exposición adicional significa poco para nosotros. Como resultado, ISO no es una buena medida para este propósito.
Una estimación aproximada de los astrofotógrafos parece ser de 500-1000 ISO, con ISO de luz del día tan baja como 1. Pero, de nuevo, esta no es una buena medida para aplicar al ojo.
¿Gama dinámica?
El rango dinámico del ojo en sí es dinámico, ya que entran en juego diferentes factores para la visión escotópica, mesópica y fotópica. Esto parece explorarse bien en ¿Cómo se compara el rango dinámico del ojo humano con el de las cámaras digitales? .
¿Tenemos algo equivalente a la velocidad de obturación?
El ojo humano es más como una cámara de video. Toma todo de una vez, lo procesa y lo envía al cerebro. El equivalente más cercano que tiene a la velocidad de obturación (o FPS) es el CFF , o frecuencia de fusión crítica, también llamada velocidad de fusión de parpadeo. Esto se define como el punto de transición donde una luz intermitente de frecuencia temporal creciente se funde en una sola luz sólida. El CFF es más alto en nuestra periferia (por lo que a veces puedes ver el parpadeo de las bombillas fluorescentes viejas solo si las miras indirectamente), y es más alto cuando es brillante. A la luz brillante, nuestro sistema visual tiene un CFF de alrededor de 60. En la oscuridad, puede llegar a ser tan bajo como 10.
Sin embargo, esta no es toda la historia, porque gran parte de esto es causado por la persistencia visual en el cerebro. El ojo en sí tiene un CFF más alto (aunque no puedo encontrar una fuente en este momento, parece recordar que es del orden de la magnitud de 100), pero nuestro cerebro confunde las cosas para disminuir la carga de procesamiento y darnos más tiempo para analizar un estímulo transitorio.
Intentando comparar una cámara y el ojo
Los ojos y las cámaras tienen propósitos completamente diferentes, incluso si parecen hacer lo mismo superficialmente. Las cámaras se construyen intencionalmente en torno a suposiciones que facilitan ciertos tipos de medición, mientras que no existe tal plan para la evolución del ojo.