Actualmente, estoy comparando dos conjuntos de datos que contienen StoreKey/ProductKeycombinaciones únicas .
El primer conjunto de datos tiene las StoreKey/ProductKeycombinaciones únicas para las ventas entre principios de enero de 2012 y finales de mayo de 2014 (resultado = 450 mil líneas). El segundo conjunto de datos tiene StoreKey/ProductKeycombinaciones únicas , para ventas que comienzan en junio de 2014, hasta hoy (resultado = 190,000 líneas).
Estoy buscando encontrar las StoreKey/ProductKeycombinaciones que están en el segundo set, pero no en el primer set, es decir, nuevos productos vendidos a principios de junio.
Hasta ahora, volqué los dos conjuntos de datos en tablas temporales, creé índices para ambas tablas en ambas claves y utilicé la EXCEPTdeclaración para encontrar elementos únicos.
¿Cuál es la forma más eficiente de comparar conjuntos de datos tan grandes? ¿Existe una forma más eficiente de hacer este tipo de comparación grande?