Programación delta-lake

Apache Spark: impacto de volver a particionar, ordenar y almacenar en caché en una unión

Estoy explorando el comportamiento de Spark al unir una tabla consigo misma. Estoy usando Databricks. Mi escenario ficticio es: Leer una tabla externa como marco de datos A (los archivos subyacentes están en formato delta) Defina el marco de datos B como el marco de datos A con solo ciertas …

10 apache-spark pyspark bigdata azure-databricks delta-lake

Preguntas etiquetadas con delta-lake