Estaba jugando VACUUM
y noté un comportamiento inesperado en el que SELECT
las filas de una tabla parecen reducir el trabajo que VACUUM
tiene que hacer después.
Datos de prueba
Nota: autovacuum está deshabilitado
CREATE TABLE numbers (num bigint);
ALTER TABLE numbers SET (
autovacuum_enabled = 'f',
toast.autovacuum_enabled = 'f'
);
INSERT INTO numbers SELECT generate_series(1, 5000);
Prueba 1
Ahora ejecutamos una actualización en todas las filas,
UPDATE numbers SET num = 0;
Y cuando corremos VACUUM (VERBOSE) numbers;
tenemos,
INFO: vacuuming "public.numbers"
INFO: "numbers": removed 5000 row versions in 23 pages
INFO: "numbers": found 5000 removable, 5000 nonremovable row versions in 45 out of 45 pages
DETAIL: 0 dead row versions cannot be removed yet, oldest xmin: 6585
There were 0 unused item pointers.
Prueba 2
Ahora emitimos otro UPDATE
, pero esta vez agregamos un SELECT
después,
UPDATE numbers SET num = 1;
SELECT * FROM numbers;
Y cuando corremos VACUUM (VERBOSE) numbers;
tenemos,
INFO: vacuuming "public.numbers"
INFO: "numbers": removed 56 row versions in 22 pages
INFO: "numbers": found 56 removable, 5000 nonremovable row versions in 45 out of 45 pages
DETAIL: 0 dead row versions cannot be removed yet, oldest xmin: 6586
There were 56 unused item pointers.
¿Qué está pasando exactamente aquí? ¿Por qué la segunda versión que ejecuto, después de SELECT
eliminar las tuplas muertas de las páginas que visita, es bastante similar VACUUM
?
Estoy ejecutando Postgres 11.3 en macOS 10.14.5.