Aquí hay algunos extractos relevantes.
P: ¿Para qué se usan las familias de columnas?
R: Las razones más comunes para usar familias de columnas: (1) usar diferentes configuraciones de compactación, comparadores, tipos de compresión, operadores de fusión o filtros de compactación en diferentes partes de datos; (2) descartar una familia de columnas para eliminar sus datos; (3) una familia de columnas para almacenar metadatos y otra para almacenar los datos.
P: ¿Cuál es la diferencia entre almacenar datos en una familia de múltiples columnas y en una base de datos de múltiples rocas?
R: Las principales diferencias serán la copia de seguridad, las escrituras atómicas y el rendimiento de las escrituras. La ventaja de usar múltiples bases de datos: la base de datos es la unidad de respaldo o punto de control. Es más fácil copiar una base de datos a otro host que una familia de columnas. Ventajas de usar familias de columnas múltiples: (1) los lotes de escritura son atómicos en familias de columnas múltiples en una base de datos. No puede lograr esto usando múltiples bases de datos RocksDB. (2) Si emite escrituras de sincronización a WAL, demasiadas bases de datos pueden dañar el rendimiento.
P: Tengo diferentes espacios clave. ¿Debo separarlos por prefijos o usar diferentes familias de columnas?
R: Si cada espacio clave es razonablemente grande, es una buena idea colocarlos en diferentes familias de columnas. Si puede ser pequeño, entonces debería considerar empaquetar múltiples espacios clave en una familia de columnas, para evitar la molestia de mantener demasiadas familias de columnas.