¿Cómo excluir valores nulos en array_agg como en string_agg usando postgres?

Question 1

Si utilizo array_aggpara recopilar nombres, obtengo mis nombres separados por comas, pero en caso de que haya un nullvalor, ese nulo también se toma como un nombre en el agregado. Por ejemplo :

SELECT g.id,
       array_agg(CASE WHEN g.canonical = 'Y' THEN g.users ELSE NULL END) canonical_users,
       array_agg(CASE WHEN g.canonical = 'N' THEN g.users ELSE NULL END) non_canonical_users
FROM groups g
GROUP BY g.id;

devuelve en ,Larry,Phillugar de solo Larry,Phil(en mi 9.1.2, se muestra NULL,Larry,Phil). como en este violín

En cambio, si lo uso string_agg(), me muestra solo los nombres (sin comas vacías o nulos) como aquí

El problema es que lo he Postgres 8.4instalado en el servidor y string_agg()no funciona allí. ¿Hay alguna forma de hacer que array_agg funcione de manera similar a string_agg ()?

Question 2

Violín SQL

select
    id,
    (select array_agg(a) from unnest(canonical_users) a where a is not null) canonical_users,
    (select array_agg(a) from unnest(non_canonical_users) a where a is not null) non_canonical_users
from (
    SELECT g.id,
           array_agg(CASE WHEN g.canonical = 'Y' THEN g.users ELSE NULL END) canonical_users,
           array_agg(CASE WHEN g.canonical = 'N' THEN g.users ELSE NULL END) non_canonical_users
    FROM groups g
    GROUP BY g.id
) s

O, más simple y puede ser más económico, usando array_to_stringque elimina los nulos:

SELECT
    g.id,
    array_to_string(
        array_agg(CASE WHEN g.canonical = 'Y' THEN g.users ELSE NULL END)
        , ','
    ) canonical_users,
    array_to_string(
        array_agg(CASE WHEN g.canonical = 'N' THEN g.users ELSE NULL END)
        , ','
    ) non_canonical_users
FROM groups g
GROUP BY g.id

Violín SQL

Question 3

Con postgresql-9.3 uno puede hacer esto;

SELECT g.id,
   array_remove(array_agg(CASE WHEN g.canonical = 'Y' THEN g.users ELSE NULL END), NULL) canonical_users,
   array_remove(array_agg(CASE WHEN g.canonical = 'N' THEN g.users ELSE NULL END), NULL) non_canonical_users
FROM groups g 
GROUP BY g.id;

Actualizar : con postgresql-9.4;

SELECT g.id,
   array_agg(g.users) FILTER (WHERE g.canonical = 'Y') canonical_users,
   array_agg(g.users) FILTER (WHERE g.canonical = 'N') non_canonical_users
FROM groups g 
GROUP BY g.id;

Question 4

Para resolver la cuestión general de eliminar nulos de los agregados de matrices, hay dos formas principales de atacar el problema: haciendo array_agg (unnest (array_agg (x)) o creando un agregado personalizado.

El primero es de la forma que se muestra arriba :

SELECT 
    array_agg(u) 
FROM (
    SELECT 
        unnest(
            array_agg(v)
        ) as u 
    FROM 
        x
    ) un
WHERE 
    u IS NOT NULL;

El segundo:

/*
With reference to
http://ejrh.wordpress.com/2011/09/27/denormalisation-aggregate-function-for-postgresql/
*/
CREATE OR REPLACE FUNCTION fn_array_agg_notnull (
    a anyarray
    , b anyelement
) RETURNS ANYARRAY
AS $$
BEGIN

    IF b IS NOT NULL THEN
        a := array_append(a, b);
    END IF;

    RETURN a;

END;
$$ IMMUTABLE LANGUAGE 'plpgsql';

CREATE AGGREGATE array_agg_notnull(ANYELEMENT) (
    SFUNC = fn_array_agg_notnull,
    STYPE = ANYARRAY,
    INITCOND = '{}'
);

Llamar al segundo es (naturalmente) un poco más agradable que el primero:

seleccione array_agg_notnull (v) de x;

Question 5

Estoy agregando esto a pesar de que este hilo es bastante antiguo, pero encontré este ingenioso truco que funciona bastante bien en arreglos pequeños. Se ejecuta en Postgres 8.4+ sin bibliotecas o funciones adicionales.

string_to_array(array_to_string(array_agg(my_column)))::int[]

En array_to_string()realidad, el método elimina los nulos.

Question 6

Si está buscando una respuesta moderna a la pregunta general de cómo eliminar un NULL de una matriz , es:

array_remove(your_array, NULL)

Tenía especial curiosidad por el rendimiento y quería compararlo con la mejor alternativa posible:

CREATE OR REPLACE FUNCTION strip_nulls(
    IN array_in ANYARRAY
)
RETURNS anyarray AS
'
SELECT
    array_agg(a)
FROM unnest(array_in) a
WHERE
    a IS NOT NULL
;
'
LANGUAGE sql
;

Al hacer una prueba pgbench se demostró (con alta confianza) que array_remove () es un poco más del doble de rápido . Hice mi prueba en números de doble precisión con una variedad de tamaños de matriz (10, 100 y 1000 elementos) y NULL aleatorios en el medio.

Question 7

Como se sugirió en los comentarios, puede escribir una función para reemplazar nulos en una matriz, sin embargo, como también se señaló en el hilo vinculado en los comentarios, este tipo de derrota la eficiencia de la función agregada si tiene que crear una agregación , divídalo y luego vuelva a agregarlo.

Creo que mantener nulos en la matriz es solo una característica (quizás no deseada) de Array_Agg. Puede usar subconsultas para evitar esto:

SELECT  COALESCE(y.ID, n.ID) ID,
        y.Users,
        n.Users
FROM    (   SELECT  g.ID, ARRAY_AGG(g.Users) AS Users
            FROM    Groups g
            WHERE   g.Canonical = 'Y'
            GROUP BY g.ID
        ) y
        FULL JOIN 
        (   SELECT  g.ID, ARRAY_AGG(g.Users) AS Users
            FROM    Groups g
            WHERE   g.Canonical = 'N'
            GROUP BY g.ID
        ) n
            ON n.ID = y.ID

Violín SQL

Question 8

Es muy simple, primero que nada cree un nuevo operador - (menos) para el texto [] :

CREATE OR REPLACE FUNCTION diff_elements_text
    (
        text[], text[] 
    )
RETURNS text[] as 
$$
    SELECT array_agg(DISTINCT new_arr.elem)
    FROM
        unnest($1) as new_arr(elem)
        LEFT OUTER JOIN
        unnest($2) as old_arr(elem)
        ON new_arr.elem = old_arr.elem
    WHERE old_arr.elem IS NULL
$$ LANGUAGE SQL IMMUTABLE;

CREATE OPERATOR - (
    PROCEDURE = diff_elements_text,
    leftarg = text[],
    rightarg = text[]
);

Y simplemente reste la matriz [nulo]:

select 
    array_agg(x)-array['']
from
    (   select 'Y' x union all
        select null union all
        select 'N' union all
        select '' 
    ) x;

Eso es todo:

{S, N}

Question 9

Una pregunta más importante es por qué extraer todos los combos de usuario / grupo a la vez. Garantizado que su interfaz de usuario no puede manejar todos esos datos. Agregar paginación a datos de gran tamaño también es una mala idea. Haga que sus usuarios filtren el conjunto antes de que vean los datos. Asegúrese de que su conjunto de opciones JOIN esté en la lista para que puedan filtrar el rendimiento si así lo desean. A veces, 2 consultas hacen que los usuarios estén más contentos si ambas son rápidas.