Relacionado con: Conocimiento actual sobre SQL Server y Hyperthreading
Recientemente actualizamos nuestro servidor de base de datos Windows 2008 R2 de un X5470 a un X5560 . La teoría es que ambas CPU tienen un rendimiento muy similar, en todo caso, el X5560 es ligeramente más rápido.
Sin embargo, el rendimiento de SQL Server 2008 R2 ha sido bastante malo durante el último día y el uso de la CPU ha sido bastante alto.
La expectativa de vida de la página es enorme, estamos obteniendo casi el 100% de aciertos de caché para las páginas, por lo que la memoria no es un problema.
Cuando corrí:
SELECT * FROM sys.dm_os_wait_stats
order by signal_wait_time_ms desc
Tengo:
wait_type waiting_tasks_count wait_time_ms max_wait_time_ms signal_wait_time_ms -------------------------------------------------- ---------- -------------------- -------------------- -------------------- -------------------- XE_TIMER_EVENT 115166 2799125790 30165 2799125065 REQUEST_FOR_DEADLOCK_SEARCH 559393 2799053973 5180 2799053973 SOS_SCHEDULER_YIELD 152289883 189948844 960 189756877 CXPACKET 234638389 2383701040 141334 118796827 SLEEP_TASK 170743505 1525669557 1406 76485386 LATCH_EX 97301008 810738519 1107 55093884 LOGMGR_QUEUE 16525384 2798527632 20751319 4083713 WRITELOG 16850119 18328365 1193 2367880 PAGELATCH_EX 13254618 8524515 11263 1670113 ASYNC_NETWORK_IO 23954146 6981220 7110 1475699 (10 filas afectadas)
Yo tambien corri
-- Isolate top waits for server instance since last restart or statistics clear
WITH Waits AS (
SELECT
wait_type,
wait_time_ms / 1000. AS [wait_time_s],
100. * wait_time_ms / SUM(wait_time_ms) OVER() AS [pct],
ROW_NUMBER() OVER(ORDER BY wait_time_ms DESC) AS [rn]
FROM sys.dm_os_wait_stats
WHERE wait_type NOT IN ('CLR_SEMAPHORE','LAZYWRITER_SLEEP','RESOURCE_QUEUE',
'SLEEP_TASK','SLEEP_SYSTEMTASK','SQLTRACE_BUFFER_FLUSH','WAITFOR','LOGMGR_QUEUE',
'CHECKPOINT_QUEUE','REQUEST_FOR_DEADLOCK_SEARCH','XE_TIMER_EVENT','BROKER_TO_FLUSH',
'BROKER_TASK_STOP','CLR_MANUAL_EVENT','CLR_AUTO_EVENT','DISPATCHER_QUEUE_SEMAPHORE',
'FT_IFTS_SCHEDULER_IDLE_WAIT','XE_DISPATCHER_WAIT', 'XE_DISPATCHER_JOIN'))
SELECT W1.wait_type,
CAST(W1.wait_time_s AS DECIMAL(12, 2)) AS wait_time_s,
CAST(W1.pct AS DECIMAL(12, 2)) AS pct,
CAST(SUM(W2.pct) AS DECIMAL(12, 2)) AS running_pct
FROM Waits AS W1
INNER JOIN Waits AS W2 ON W2.rn <= W1.rn
GROUP BY W1.rn, W1.wait_type, W1.wait_time_s, W1.pct
HAVING SUM(W2.pct) - W1.pct < 95; -- percentage threshold
Y consiguió
wait_type wait_time_s pct running_pct CXPACKET 554821.66 65.82 65.82 LATCH_EX 184123.16 21.84 87.66 SOS_SCHEDULER_YIELD 37541.17 4.45 92.11 PAGEIOLATCH_SH 19018.53 2.26 94.37 FT_IFTSHC_MUTEX 14306.05 1.70 96.07
Eso muestra enormes cantidades de tiempo sincronizando consultas que involucran paralelismo (alto CXPACKET). Además, anecdóticamente, muchas de estas consultas problemáticas se ejecutan en múltiples núcleos (no tenemos sugerencias de MAXDOP en ningún lugar de nuestro código)
El servidor no ha estado bajo carga durante más de un día más o menos. Estamos experimentando una gran variación con las ejecuciones de consultas, por lo general, muchas consultas parecen ser más lentas que en nuestro servidor de base de datos anterior y la CPU es realmente alta.
¿Deshabilitar Hyperthreading ayudará a reducir el uso de nuestra CPU y aumentar el rendimiento?