¿Son las "carreras de datos" y la "condición de carrera" realmente lo mismo en el contexto de la programación concurrente?

Question 1

A menudo encuentro que estos términos se utilizan en el contexto de la programación concurrente. ¿Son iguales o diferentes?

Question 2

No, no son lo mismo. No son un subconjunto entre sí. Tampoco son la condición necesaria ni suficiente el uno para el otro.

La definición de una carrera de datos es bastante clara y, por lo tanto, su descubrimiento puede automatizarse. Se produce una carrera de datos cuando 2 instrucciones de diferentes subprocesos acceden a la misma ubicación de memoria, al menos uno de estos accesos es una escritura y no hay sincronización que imponga un orden particular entre estos accesos.

Una condición de carrera es un error semántico. Es una falla que ocurre en la sincronización o el orden de los eventos que conduce a un comportamiento erróneo del programa. Muchas condiciones de carrera pueden deberse a carreras de datos, pero esto no es necesario.

Considere el siguiente ejemplo simple donde x es una variable compartida:

Thread 1    Thread 2

 lock(l)     lock(l)
 x=1         x=2
 unlock(l)   unlock(l)

En este ejemplo, las escrituras ax del subproceso 1 y 2 están protegidas por bloqueos, por lo tanto, siempre están sucediendo en algún orden impuesto por el orden con el que se adquieren los bloqueos en tiempo de ejecución. Es decir, la atomicidad de las escrituras no se puede romper; siempre hay una relación suceda antes entre las dos escrituras en cualquier ejecución. Simplemente no podemos saber qué escritura ocurre antes que la otra a priori.

No hay un orden fijo entre las escrituras, porque los bloqueos no pueden proporcionar esto. Si la corrección de los programas se ve comprometida, digamos que cuando la escritura en x por el hilo 2 es seguida por la escritura en x en el hilo 1, decimos que hay una condición de carrera, aunque técnicamente no hay carrera de datos.

Es mucho más útil detectar condiciones de carrera que carreras de datos; sin embargo, esto también es muy difícil de lograr.

Construir el ejemplo inverso también es trivial. Esta publicación de blog también explica muy bien la diferencia, con un ejemplo de transacción bancaria simple.

Question 3

Según Wikipedia, el término "condición de carrera" se ha utilizado desde los días de las primeras puertas lógicas electrónicas. En el contexto de Java, una condición de carrera puede pertenecer a cualquier recurso, como un archivo, una conexión de red, un hilo de un grupo de hilos, etc.

Es mejor reservar el término "carrera de datos" por su significado específico definido por la JLS .

El caso más interesante es una condición de carrera que es muy similar a una carrera de datos, pero aún no lo es, como en este simple ejemplo:

class Race {
  static volatile int i;
  static int uniqueInt() { return i++; }
}

Dado que ies volátil, no hay carrera de datos; sin embargo, desde el punto de vista de la corrección del programa, existe una condición de carrera debido a la no atomicidad de las dos operaciones: leer i, escribir i+1. Varios subprocesos pueden recibir el mismo valor de uniqueInt.

Question 4

No, son diferentes y ninguno de ellos es un subconjunto de uno o viceversa.

El término condición de carrera a menudo se confunde con el término relacionado carrera de datos, que surge cuando la sincronización no se usa para coordinar todo el acceso a un campo compartido no final. Corre el riesgo de una carrera de datos cada vez que un hilo escribe una variable que podría ser leída por otro hilo o lee una variable que podría haber sido escrita por última vez por otro hilo si ambos hilos no usan sincronización; El código con carreras de datos no tiene una semántica definida útil en el modelo de memoria de Java. No todas las condiciones de carrera son carreras de datos, y no todas las carreras de datos son condiciones de carrera, pero ambas pueden hacer que los programas simultáneos fallen de formas impredecibles.

Tomado del excelente libro - Java Concurrency in Practice de Joshua Bloch & Co.

Question 5

TL; DR: La distinción entre raza de datos y condición de carrera depende de la naturaleza de la formulación del problema y de dónde trazar el límite entre el comportamiento indefinido y el comportamiento bien definido pero indeterminado. La distinción actual es convencional y refleja mejor la interfaz entre el arquitecto del procesador y el lenguaje de programación.

1. Semántica

La carrera de datos se refiere específicamente a los "accesos de memoria" en conflicto no sincronizados (o acciones u operaciones) a la misma ubicación de memoria. Si no hay conflicto en los accesos a la memoria, mientras todavía hay un comportamiento indeterminado causado por el orden de las operaciones, esa es una condición de carrera.

Tenga en cuenta que aquí los "accesos a la memoria" tienen un significado específico. Se refieren a las acciones de almacenamiento o carga de memoria "pura", sin ninguna semántica adicional aplicada. Por ejemplo, un almacén de memoria de un subproceso no sabe (necesariamente) cuánto tiempo tardan los datos en escribirse en la memoria y finalmente se propaga a otro subproceso. Para otro ejemplo, un almacenamiento de memoria en una ubicación antes de otro almacenamiento en otra ubicación por el mismo hilo no garantiza (necesariamente) que los primeros datos escritos en la memoria estén por delante del segundo. Como resultado, el orden de esos accesos a la memoria pura no puede (necesariamente) ser "razonado" , y cualquier cosa podría suceder, a menos que esté bien definido.

Cuando los "accesos a la memoria" están bien definidos en términos de ordenación a través de la sincronización, la semántica adicional puede asegurar que, incluso si el tiempo de los accesos a la memoria es indeterminado, su orden se puede "razonar" a través de las sincronizaciones. Tenga en cuenta que, aunque se puede razonar el orden entre los accesos a la memoria, no están necesariamente determinados, de ahí la condición de carrera.

2. ¿Por qué la diferencia?

Pero si el orden sigue siendo indeterminado en la condición de carrera, ¿por qué molestarse en distinguirlo de la carrera de datos? La razón es más práctica que teórica. Es porque la distinción existe en la interfaz entre el lenguaje de programación y la arquitectura del procesador.

Una instrucción de carga / almacenamiento de memoria en la arquitectura moderna generalmente se implementa como acceso a la memoria "pura", debido a la naturaleza de la canalización fuera de orden, la especulación, el caché de varios niveles, la interconexión cpu-ram, especialmente el de varios núcleos, etc. Hay muchos factores que conducen a tiempos y pedidos indeterminados. Hacer cumplir el pedido de cada instrucción de memoria conlleva una gran penalización, especialmente en un diseño de procesador que admite varios núcleos. Entonces, la semántica de ordenamiento se proporciona con instrucciones adicionales como varias barreras (o vallas).

La carrera de datos es la situación en la que se ejecuta la instrucción del procesador sin barreras adicionales para ayudar a razonar el orden de los accesos a la memoria en conflicto. El resultado no solo es indeterminado, sino también posiblemente muy extraño, por ejemplo, dos escrituras en la misma ubicación de palabra por diferentes subprocesos pueden resultar con cada mitad de la palabra escrita, o solo pueden operar sobre sus valores en caché local. - Estos son comportamientos indefinidos, desde el punto de vista del programador. Pero (normalmente) están bien definidos desde el punto de vista del arquitecto del procesador.

Los programadores deben tener una forma de razonar la ejecución de su código. La carrera de datos es algo que no pueden tener sentido, por lo que siempre deben evitarlo (normalmente). Es por eso que las especificaciones de lenguaje que son de nivel suficientemente bajo suelen definir la carrera de datos como un comportamiento indefinido, diferente del comportamiento de memoria bien definido de la condición de carrera.

3. Modelos de memoria lingüística

Los diferentes procesadores pueden tener un comportamiento de acceso a la memoria diferente, es decir, el modelo de memoria del procesador. Es incómodo para los programadores estudiar el modelo de memoria de cada procesador moderno y luego desarrollar programas que puedan beneficiarse de ellos. Es deseable que el lenguaje pueda definir un modelo de memoria para que los programas de ese lenguaje siempre se comporten como se espera como lo define el modelo de memoria. Es por eso que Java y C ++ tienen definidos sus modelos de memoria. Es responsabilidad de los desarrolladores del compilador / tiempo de ejecución garantizar que los modelos de memoria del lenguaje se apliquen en las diferentes arquitecturas de procesador.

Dicho esto, si un lenguaje no quiere exponer el comportamiento de bajo nivel del procesador (y está dispuesto a sacrificar ciertos beneficios de rendimiento de las arquitecturas modernas), puede optar por definir un modelo de memoria que oculte por completo los detalles de "puro". accesos a la memoria, pero aplican la semántica de ordenamiento para todas sus operaciones de memoria. Entonces, los desarrolladores del compilador / tiempo de ejecución pueden optar por tratar cada variable de memoria como volátil en todas las arquitecturas de procesador. Para estos lenguajes (que admiten memoria compartida entre subprocesos), no hay carreras de datos, pero aún pueden existir condiciones de carrera, incluso con un lenguaje de consistencia secuencial completa.

Por otro lado, el modelo de memoria del procesador puede ser más estricto (o menos relajado, o en un nivel más alto), por ejemplo, implementando consistencia secuencial como lo hacía el procesador de los primeros días. Luego, se ordenan todas las operaciones de memoria y no existe una carrera de datos para los idiomas que se ejecutan en el procesador.

4. Conclusión

Volviendo a la pregunta original, en mi humilde opinión, está bien definir la carrera de datos como un caso especial de condición de carrera, y la condición de carrera en un nivel puede convertirse en carrera de datos en un nivel superior. Depende de la naturaleza de la formulación del problema y de dónde trazar el límite entre el comportamiento indefinido y el comportamiento bien definido pero indeterminado. Solo la convención actual define el límite en la interfaz de procesador de lenguaje, no necesariamente significa que siempre sea y deba ser así; pero la convención actual probablemente refleja mejor la interfaz (y la sabiduría) de vanguardia entre el arquitecto del procesador y el lenguaje de programación.