¿Cuál es el estado de la E / S asíncrona (AIO) POSIX?

Question 1

Hay páginas esparcidas por la web que describen las instalaciones POSIX AIO con distintos detalles. Ninguno de ellos es terriblemente reciente. No está claro qué es exactamente lo que están describiendo. Por ejemplo, el sitio web "oficial" (?) Para el soporte de E / S asíncronas del kernel de Linux aquí dice que los sockets no funcionan, pero las páginas del manual "aio.h" en mi estación de trabajo Ubuntu 8.04.1 parecen implicar que funciona para descriptores de archivos arbitrarios. Luego hay otro proyecto que parece funcionar en la capa de la biblioteca con incluso menos documentación.

Me gustaría saber:

¿Cuál es el propósito de POSIX AIO? Dado que el ejemplo más obvio de una implementación que puedo encontrar dice que no admite sockets, todo me parece extraño. ¿Es solo para E / S de disco asíncrono? Si es así, ¿por qué la API hipergeneral? Si no es así, ¿por qué la E / S de disco es lo primero que fue atacado?
¿Dónde hay ejemplos de programas POSIX AIO completos que pueda ver?
¿Alguien realmente lo usa, de verdad?
¿Qué plataformas son compatibles con POSIX AIO? ¿Qué partes apoyan? ¿Alguien realmente apoya el implícito "Cualquier E / S a cualquier FD" que <aio.h>parece prometer?

Los otros mecanismos de multiplexación disponibles para mí son perfectamente buenos, pero los fragmentos aleatorios de información que flotan por ahí me han dado curiosidad.

Question 2

La E / S de red no es una prioridad para AIO porque todos los que escriben servidores de red POSIX utilizan un enfoque sin bloqueo basado en eventos. El enfoque antiguo de Java de "miles de millones de hilos de bloqueo" apesta horriblemente.

La E / S de escritura de disco ya está almacenada en búfer y la E / S de lectura de disco se puede recuperar previamente en el búfer mediante funciones como posix_fadvise. Eso deja la E / S de disco directa y sin búfer como el único propósito útil para AIO.

La E / S directa sin búfer solo es realmente útil para las bases de datos transaccionales, y estas tienden a escribir sus propios hilos o procesos para administrar la E / S de su disco.

Entonces, al final eso deja a POSIX AIO en la posición de no cumplir ningún propósito útil. No lo use.

Question 3

Hacer E / S de socket de manera eficiente se ha resuelto con kqueue, epoll, puertos de finalización de E / S y similares. Hacer E / S de archivos asincrónicas es una especie de llegada tardía (aparte de las E / S superpuestas de Windows y el soporte temprano de Solaris para posix AIO).

Si está buscando hacer E / S de socket, probablemente sea mejor que use uno de los mecanismos anteriores.

El objetivo principal de AIO es, por tanto, resolver el problema de la E / S de disco asíncrona. Es muy probable que esta sea la razón por la que Mac OS X solo admite AIO para archivos normales y no sockets (ya que kqueue lo hace mucho mejor de todos modos).

Las operaciones de escritura generalmente se almacenan en caché por el kernel y se eliminan en un momento posterior. Por ejemplo, cuando el cabezal de lectura de la unidad pasa por la ubicación donde se va a escribir el bloque.

Sin embargo, para las operaciones de lectura, si desea que el kernel priorice y ordene sus lecturas, AIO es realmente la única opción. He aquí por qué el kernal puede (teóricamente) hacerlo mejor que cualquier aplicación de nivel de usuario:

El kernel ve todas las E / S del disco, no solo los trabajos de disco de las aplicaciones, y puede ordenarlos a nivel global
El kernel (puede) saber dónde está el cabezal de lectura del disco y puede elegir los trabajos de lectura que le transmita en el orden óptimo, para mover el cabezal la distancia más corta
El kernel puede aprovechar la cola de comandos nativa para optimizar aún más sus operaciones de lectura
Es posible que pueda realizar más operaciones de lectura por llamada al sistema usando lio_listio () que con readv (), especialmente si sus lecturas no son (lógicamente) contiguas, lo que ahorra una pequeña parte de la sobrecarga de llamadas del sistema.
Su programa puede ser un poco más simple con AIO ya que no necesita un hilo adicional para bloquear en una llamada de lectura o escritura.

Dicho esto, posix AIO tiene una interfaz bastante incómoda, por ejemplo:

El único medio eficiente y bien soportado de devoluciones de llamada de eventos es a través de señales, lo que dificulta su uso en una biblioteca, ya que significa usar números de señal del espacio de nombres de señal global del proceso. Si su sistema operativo no admite señales en tiempo real, también significa que debe recorrer todas sus solicitudes pendientes para averiguar cuál terminó realmente (este es el caso de Mac OS X, por ejemplo, no de Linux). La captura de señales en un entorno de subprocesos múltiples también crea algunas restricciones complicadas. Por lo general, no puede reaccionar al evento dentro del controlador de señales, pero debe generar una señal, escribir en una tubería o usar signalfd () (en Linux).
lio_suspend () tiene los mismos problemas que select (), no escala muy bien con la cantidad de trabajos.
lio_listio (), tal como se implementó, tiene un número bastante limitado de trabajos que puede pasar, y no es trivial encontrar este límite de manera portátil. Debe llamar a sysconf (_SC_AIO_LISTIO_MAX), que puede fallar, en cuyo caso puede usar la definición AIO_LISTIO_MAX, que no está necesariamente definida, pero luego puede usar 2, que se define como compatible con garantía.

En cuanto a la aplicación del mundo real que usa posix AIO, puede echar un vistazo a lighttpd (lighty), que también publicó una medición de rendimiento al presentar el soporte.

La mayoría de las plataformas posix soportan posix AIO por ahora (Linux, BSD, Solaris, AIX, tru64). Windows lo admite a través de su E / S de archivos superpuestos. Tengo entendido que solo Solaris, Windows y Linux realmente admiten async. E / S de archivos hasta el controlador, mientras que los otros sistemas operativos emulan el archivo async. E / S con subprocesos del kernel. Linux es la excepción, su implementación posix AIO en glibc emula operaciones asíncronas con subprocesos de nivel de usuario, mientras que su interfaz nativa de E / S asíncrona (io_submit (), etc.) es verdaderamente asíncrona hasta el controlador, asumiendo que el controlador lo admite. .

Creo que es bastante común entre los sistemas operativos no admitir posix AIO para ningún fd, pero restringirlo a archivos normales.

Question 4

Un desarrollador de libtorrent proporciona un informe sobre esto: http://blog.libtorrent.org/2012/10/asynchronous-disk-io/

Question 5

Hay aio_write - implementado en glibc; La primera llamada de la función aio_read o aio_write genera una cantidad de subprocesos en modo de usuario, solicitudes de publicación de aio_write o aio_read a ese subproceso, el subproceso hace pread / pwrite y cuando termina, la respuesta se vuelve a publicar en el subproceso de llamada bloqueado.

También es aio 'real', compatible con el nivel del kernel (necesita libaio para eso, consulte la llamada io_submit http://linux.die.net/man/2/io_submit ); también necesita O_DIRECT para eso (también puede que no sea compatible con todos los sistemas de archivos, pero los principales sí lo admiten)

mira aquí:

http://lse.sourceforge.net/io/aio.html

http://linux.die.net/man/2/io_submit

¿Diferencia entre POSIX AIO y libaio en Linux?