¿Cuál es la diferencia entre una base de datos y un almacén de datos?
¿No son lo mismo, o al menos están escritos en lo mismo (es decir, Oracle RDBMS)?
¿Cuál es la diferencia entre una base de datos y un almacén de datos?
¿No son lo mismo, o al menos están escritos en lo mismo (es decir, Oracle RDBMS)?
Respuestas:
Mira esto para más información.
Desde un enlace anterior:
Base de datos
Almacén de datos
También es importante tener en cuenta que los almacenes de datos se pueden obtener de cero a muchas bases de datos.
Desde una vista no técnica: una base de datos está restringida a una aplicación o conjunto de aplicaciones en particular.
Un almacén de datos es un repositorio de datos de nivel empresarial. Contendrá datos de todos / muchos segmentos de la empresa. Compartirá esta información para proporcionar una imagen global del negocio. También es fundamental para la integración entre los diferentes segmentos del negocio.
Desde una vista técnica: La palabra "Data Warehouse" no tiene una definición reconocida. Personalmente, defino un almacén de datos como una colección de data marts. Donde cada centro de datos consiste en una o más bases de datos donde la base de datos es específica para un conjunto de problemas específico (aplicación, conjunto de datos o proceso).
En pocas palabras, una base de datos es un componente de un almacén de datos. Hay muchos lugares para explorar este concepto, pero debido a que no existe una "definición", encontrará desafíos con cualquier respuesta que dé.
Un almacén de datos es un TIPO de base de datos.
Además de lo que la gente ya ha dicho, los almacenes de datos tienden a ser OLAP, con índices, etc. ajustados para leer, no escribir, y los datos se desnormalizan / transforman en formas que son más fáciles de leer y analizar.
Algunas personas han dicho que las "bases de datos" son lo mismo que OLTP; esto no es cierto. OLTP, nuevamente, es un TIPO de base de datos.
Otros tipos de "bases de datos": archivos de texto, XML, Excel, CSV ..., archivos planos :-)
It is a logical subset of Data warehouse, generally based upon business functions.
La forma más sencilla de explicarlo sería decir que un almacén de datos consta de algo más que una base de datos. Una base de datos es una colección de datos organizados de alguna manera, pero un almacén de datos está organizado específicamente para "facilitar la presentación de informes y el análisis". Sin embargo, esta no es toda la historia, ya que el almacenamiento de datos también contiene "los medios para recuperar y analizar datos, extraer, transformar y cargar datos, y para administrar el diccionario de datos también se consideran componentes esenciales de un sistema de almacenamiento de datos".
Base de datos : - OLTP (proceso de transacción en línea)
Almacén de datos
Data Warehouse vs Database: un data warehouse está especialmente diseñado para el análisis de datos, lo que implica leer grandes cantidades de datos para comprender las relaciones y tendencias en los datos. Se utiliza una base de datos para capturar y almacenar datos, como registrar detalles de una transacción.
Data Warehouse: cargas de trabajo adecuadas : análisis, informes, big data. Fuente de datos : datos recopilados y normalizados de muchas fuentes. Captura de datos : operaciones de escritura masiva generalmente en un programa de lote predeterminado. Normalización de datos : esquemas desnormalizados, como el esquema Star o el esquema Snowflake. Almacenamiento de datos : optimizado para la simplicidad de acceso y consultas de alta velocidad. rendimiento mediante almacenamiento en columnas. Acceso a datos : optimizado para minimizar las E / S y maximizar el rendimiento de datos.
Base de datos transaccional: cargas de trabajo adecuadas: procesamiento de transacciones. Fuente de datos : los datos capturados tal cual son de una sola fuente, como un sistema transaccional. Captura de datos : optimizado para operaciones de escritura continua, ya que hay nuevos datos disponibles para maximizar el rendimiento de las transacciones. Normalización de datos : esquemas estáticos altamente normalizados. Almacenamiento de datos : optimizado para operaciones de escritura altas en un solo bloque físico orientado a filas. Acceso a datos : grandes volúmenes de pequeñas operaciones de lectura.
Cualquier almacenamiento de datos para la aplicación generalmente usa la base de datos. Podría ser una base de datos relacional o ninguna base de datos sql que actualmente está en tendencia.
El almacén de datos también es una base de datos. Podemos llamar a la base de datos del almacén de datos como almacenamiento de datos especializado para fines de informes analíticos para la empresa. Estos datos se utilizan para la decisión comercial clave.
Los datos organizados ayudan a informar y tomar decisiones comerciales de manera efectiva.
Base de datos:
Utilizado para el procesamiento transaccional en línea (OLTP).
Almacén de datos:
Utilizado para el procesamiento analítico en línea (OLAP).
Un Data Warehousing (DW) es un proceso para recopilar y administrar datos de diversas fuentes para proporcionar información comercial significativa. Un almacén de datos generalmente se usa para conectar y analizar datos comerciales de fuentes heterogéneas. El almacén de datos es el núcleo del sistema de BI creado para el análisis de datos y la generación de informes.
La fuente para el almacén de datos puede ser un grupo de bases de datos, porque las bases de datos se utilizan para el proceso de transacciones en línea, como mantener los registros actuales ... pero en el almacén de datos almacena datos históricos que son para el proceso analítico en línea.
Un almacén de datos es un tipo de estructura de datos generalmente alojado en una base de datos. El Data Warehouse se refiere al modelo de datos y a qué tipo de datos se almacenan allí: datos que se modelan (modelo de datos) para servir a un propósito analítico.
Una base de datos se puede clasificar como cualquier estructura que alberga datos. Tradicionalmente, sería un RDBMS como Oracle, SQL Server o MySQL. Sin embargo, una base de datos también puede ser una base de datos NoSQL como Apache Cassandra, o un MPP columnar como AWS RedShift.
Verá que una base de datos es simplemente un lugar para almacenar datos; Un almacén de datos es una forma específica de almacenar datos y tiene un propósito específico, que es atender consultas analíticas.
OLTP vs OLAP no le dice la diferencia entre un DW y una base de datos, tanto OLTP como OLAP residen en bases de datos. Simplemente almacenan datos de una manera diferente (diferentes metodologías de modelo de datos) y sirven para diferentes propósitos (OLTP: registrar transacciones, optimizado para actualizaciones; OLAP: analizar información, optimizado para lecturas).
Ver en palabras simples: Dataware -> Datos enormes usando Analítico / almacenamiento / copia y Análisis. Base de datos -> Operación CRUD con datos de uso frecuente.
Dataware house es un tipo de almacenamiento que no está utilizando a diario y la base de datos es algo que está tratando con frecuencia.
P.ej. Si solicitamos un estado de cuenta bancario, nos da los últimos 3/4/6 / más meses porque está en la base de datos. Si desea más que eso, se almacena en la casa de Dataware.
Ejemplo: una casa vale $100,000
, y se está apreciando $1000
por año.
Para realizar un seguimiento del valor actual de la vivienda, utilizaría una base de datos, ya que el valor cambiaría cada año.
Tres años después, podría ver el valor de la casa que es $103,000.
Para realizar un seguimiento del valor histórico de la vivienda, debe utilizar un almacén de datos, ya que el valor de la vivienda debe ser
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.