Actualmente, estoy comparando dos conjuntos de datos que contienen StoreKey/ProductKey
combinaciones únicas .
El primer conjunto de datos tiene las StoreKey/ProductKey
combinaciones únicas para las ventas entre principios de enero de 2012 y finales de mayo de 2014 (resultado = 450 mil líneas). El segundo conjunto de datos tiene StoreKey/ProductKey
combinaciones únicas , para ventas que comienzan en junio de 2014, hasta hoy (resultado = 190,000 líneas).
Estoy buscando encontrar las StoreKey/ProductKey
combinaciones que están en el segundo set, pero no en el primer set, es decir, nuevos productos vendidos a principios de junio.
Hasta ahora, volqué los dos conjuntos de datos en tablas temporales, creé índices para ambas tablas en ambas claves y utilicé la EXCEPT
declaración para encontrar elementos únicos.
¿Cuál es la forma más eficiente de comparar conjuntos de datos tan grandes? ¿Existe una forma más eficiente de hacer este tipo de comparación grande?