Este es un error con SQL Server. Si se elimina una columna de una tabla con un índice de almacén de columnas en clúster, y luego se agrega una nueva columna con el mismo nombre, parece estar usando la antigua columna eliminada para el predicado. Aquí está el MVCE:
Este script comienza con 10000
filas con statusId
of 1
y statusId2
of 5
, luego suelta la statusID
columna y cambia el nombre statusId2
a statusId
. Entonces, al final, todas las filas deben tener un statusId
5.
Pero la siguiente consulta golpea el índice no agrupado ...
select *
from example
where statusId = 1
and total <= @filter
and barcode = @barcode
and id2 = @id2
... y devuelve 2
filas (con el seleccionado statusId
diferente del implícito en la WHERE
cláusula) ...
+-------+---------+------+-------+----------+
| id | barcode | id2 | total | statusId |
+-------+---------+------+-------+----------+
| 5 | 5 | NULL | 5.00 | 5 |
| 10005 | 5 | NULL | 5.00 | 5 |
+-------+---------+------+-------+----------+
... mientras que este accede al almacén de columnas y devuelve correctamente 0
select count(*)
from example
where statusId = 1
MVCE
/*Create table with clustered columnstore and non clustered rowstore*/
CREATE TABLE example
(
id INT IDENTITY(1, 1),
barcode CHAR(22),
id2 INT,
total DECIMAL(10,2),
statusId TINYINT,
statusId2 TINYINT,
INDEX cci_example CLUSTERED COLUMNSTORE,
INDEX ix_example (barcode, total)
);
/* Insert 10000 rows all with (statusId,statusId2) = (1,5) */
INSERT example
(barcode,
id2,
total,
statusId,
statusId2)
SELECT TOP (10000) barcode = row_number() OVER (ORDER BY @@spid),
id2 = NULL,
total = row_number() OVER (ORDER BY @@spid),
statusId = 1,
statusId2 = 5
FROM sys.all_columns c1, sys.all_columns c2;
ALTER TABLE example
DROP COLUMN statusid
/* Now have 10000 rows with statusId2 = 5 */
EXEC sys.sp_rename
@objname = N'dbo.example.statusId2',
@newname = 'statusId',
@objtype = 'COLUMN';
/* Now have 10000 rows with StatusID = 5 */
INSERT example
(barcode,
id2,
total,
statusId)
SELECT TOP (10000) barcode = row_number() OVER (ORDER BY @@spid),
id2 = NULL,
total = row_number() OVER (ORDER BY @@spid),
statusId = 5
FROM sys.all_columns c1, sys.all_columns c2;
/* Now have 20000 rows with StatusID = 5 */
DECLARE @filter DECIMAL = 5,
@barcode CHAR(22) = '5',
@id2 INT = NULL;
/*This returns 2 rows from the NCI*/
SELECT *
FROM example WITH (INDEX = ix_example)
WHERE statusId = 1
AND total <= @filter
AND barcode = @barcode
AND id2 = @id2;
/*This counts 0 rows from the Columnstore*/
SELECT COUNT(*)
FROM example
WHERE statusId = 1;
También he planteado un problema en el portal de comentarios de Azure :
Y para cualquier otra persona que se encuentre con esto, la reconstrucción del índice de almacén de columnas en clúster soluciona el problema:
alter index cci_example on example rebuild
La reconstrucción de CCI solo corrige los datos existentes. Si se agregan nuevos registros, el problema surge nuevamente en estos registros; así que actualmente la única solución conocida para la tabla es recrearla por completo.