Preguntas etiquetadas con x86

x86 es una arquitectura derivada de la CPU Intel 8086. La familia x86 incluye las arquitecturas IA-32 de 32 bits y x86-64 de 64 bits, así como las arquitecturas heredadas de 16 bits. Las preguntas sobre este último deben etiquetarse [x86-16] y / o [emu8086]. Utilice la etiqueta [x86-64] si su pregunta es específica para x86-64 de 64 bits. Para la FPU x86, use la etiqueta [x87]. Para SSE1 / 2/3/4 / AVX * también use [sse], y cualquiera de [avx] / [avx2] / [avx512] que aplique

10
Reemplazar un contador de bucle de 32 bits con 64 bits introduce desviaciones de rendimiento locas con _mm_popcnt_u64 en las CPU Intel
Estaba buscando la forma más rápida de obtener popcountgrandes conjuntos de datos. Encontré un efecto muy extraño : cambiar la variable de bucle de unsigneda uint64_thizo que el rendimiento se redujera en un 50% en mi PC. El punto de referencia #include <iostream> #include <chrono> #include <x86intrin.h> int main(int argc, …





12
¿Cómo compilar Tensorflow con las instrucciones SSE4.2 y AVX?
Este es el mensaje recibido al ejecutar un script para verificar si Tensorflow está funcionando: I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.so.1 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully …

3
¿Qué es un retpoline y cómo funciona?
Con el fin de mitigar la divulgación de memoria de kernel o de procesos cruzados (el ataque Spectre ), el kernel 1 de Linux se compilará con una nueva opción , -mindirect-branch=thunk-externintroducida gccpara realizar llamadas indirectas a través de una llamada retpoline . Este parece ser un término recién inventado, …

10
¿Cómo se ve el lenguaje ensamblador multinúcleo?
Érase una vez, para escribir el ensamblador x86, por ejemplo, tendría instrucciones que indicaran "cargue el registro EDX con el valor 5", "incremente el registro EDX", etc. Con las CPU modernas que tienen 4 núcleos (o incluso más), a nivel de código de máquina, ¿parece que hay 4 CPU separadas …
243 assembly  x86  cpu  multicore  smp 



5
¿Cómo difiere la arquitectura ARM de x86? [cerrado]
Cerrado. Esta pregunta no cumple con las pautas de desbordamiento de pila . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que sea sobre el tema de Stack Overflow. Cerrado hace 4 años . Mejora esta pregunta ¿La arquitectura x86 está especialmente diseñada para funcionar …
192 x86  arm 

3
¿Por qué GCC genera un ensamblaje tan radicalmente diferente para casi el mismo código C?
Mientras escribía una ftolfunción optimizada , encontré un comportamiento muy extraño en GCC 4.6.1. Déjame mostrarte el código primero (para mayor claridad, marqué las diferencias): fast_trunc_one, C: int fast_trunc_one(int i) { int mantissa, exponent, sign, r; mantissa = (i & 0x07fffff) | 0x800000; exponent = 150 - ((i >> 23) …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.