Los elementos repetibles se almacenan en un diccionario y se asigna un código como sustituto.
ESTA ES UNA SIMPLIFICACIÓN SUPERIOR
aaaaaaaaaaaaaaaaaaaaaaaa 0001
bbbbbbbbbbbbbbbbbbbbbbbb 0002
alsdjl;asjdfkl;asdfjkljj 0003
en lugar de la línea completa, simplemente puso el código en su lugar. Cuanto más grande es el diccionario, más códigos puede manejar. Normalmente, cuando un diccionario se llena, comienza uno nuevo sobre la marcha. Cuando comienza uno nuevo, está en blanco y se asignan nuevos códigos a los patrones detectados.
En general, cuanto más grande, mejor hasta cierto punto. Todo el diccionario se guarda en la memoria, por lo que necesita más RAM que el tamaño del diccionario.
El tamaño del diccionario depende de la compresibilidad de sus datos, la cantidad de archivos, el tamaño y el tamaño general.
En general, 32 MB es más que suficiente, pero si está comprimiendo numerosos archivos de varios conciertos, se puede usar un número mucho mayor. Los diccionarios más grandes a menudo hacen que el proceso sea más lento, pero los resultados en un archivo más pequeño.