¿Cuál es la diferencia entre una base de datos y un almacén de datos?


163

¿Cuál es la diferencia entre una base de datos y un almacén de datos?

¿No son lo mismo, o al menos están escritos en lo mismo (es decir, Oracle RDBMS)?

Respuestas:


147

Mira esto para más información.

Desde un enlace anterior:

Base de datos

  1. Se utiliza para el procesamiento transaccional en línea ( OLTP ), pero se puede utilizar para otros fines, como el almacenamiento de datos. Esto registra los datos del usuario para el historial.
  2. Las tablas y las combinaciones son complejas ya que están normalizadas (para RDMS ). Esto se hace para reducir los datos redundantes y ahorrar espacio de almacenamiento.
  3. Entidad: las técnicas de modelado relacional se utilizan para el diseño de bases de datos RDMS.
  4. Optimizado para la operación de escritura.
  5. El rendimiento es bajo para las consultas de análisis.

Almacén de datos

  1. Utilizado para el procesamiento analítico en línea ( OLAP ). Esto lee los datos históricos de los usuarios para las decisiones comerciales.
  2. Las tablas y las combinaciones son simples ya que están desnormalizadas. Esto se hace para reducir el tiempo de respuesta para consultas analíticas.
  3. Datos: se utilizan técnicas de modelado para el diseño del Almacén de datos.
  4. Optimizado para operaciones de lectura.
  5. Alto rendimiento para consultas analíticas.
  6. Es por lo general una base de datos.

También es importante tener en cuenta que los almacenes de datos se pueden obtener de cero a muchas bases de datos.


3
El modelado de datos es un término genérico y no solo se aplica a los almacenes de datos. (Quizás en el segundo # 3 se referían a "modelado dimensional", ya que esa es, en mi experiencia, la forma más popular de construirlos). La última línea no tiene sentido: ¿cómo un almacén de datos "contiene" una base de datos? Podría decir que un almacén de datos se obtiene de 0 a muchas bases de datos (OLTP).
Patrick Marchand

2
@ Mark - ¿Dónde dice que las bases de datos son SOLO para OLTP? Muestra cómo las bases de datos se relacionan con los almacenes de datos.
TheCloudlessSky

55
@Nickolay: esta es una respuesta de dos años. Edítala y arréglala si te preocupa.
TheCloudlessSky

1
@DataMan: marque esto como respuesta correcta. Es una respuesta bastante buena y justa para su pregunta.
sanzy

1
¿Cuál es la diferencia entre técnicas de modelado de datos y técnicas de modelado relacional?
QAIS

32

Desde una vista no técnica: una base de datos está restringida a una aplicación o conjunto de aplicaciones en particular.

Un almacén de datos es un repositorio de datos de nivel empresarial. Contendrá datos de todos / muchos segmentos de la empresa. Compartirá esta información para proporcionar una imagen global del negocio. También es fundamental para la integración entre los diferentes segmentos del negocio.

Desde una vista técnica: La palabra "Data Warehouse" no tiene una definición reconocida. Personalmente, defino un almacén de datos como una colección de data marts. Donde cada centro de datos consiste en una o más bases de datos donde la base de datos es específica para un conjunto de problemas específico (aplicación, conjunto de datos o proceso).

En pocas palabras, una base de datos es un componente de un almacén de datos. Hay muchos lugares para explorar este concepto, pero debido a que no existe una "definición", encontrará desafíos con cualquier respuesta que dé.


¿Datamart es preferiblemente una base de datos OLTP?
CᴴᴀZ

@ CᴴᴀZ para qué? Datamart se crean para OLAP, Datamart es un DWH pequeño (para una pequeña parte del negocio). está creado para el análisis, por lo que si necesita un sistema OLTP, un Datamart no es su elección, si necesita un modelo de datos para el análisis (esquema de inicio o flujo de nieve), entonces preferiría un Datamart.
Enrique Benito Casado

Hola @Enrique, entendí tu punto: Datamart contribuye al OLAP. Tomé el ejemplo de que Datamarts es OLTP desde aquí: SQL Server OLTP Datamart .
CᴴᴀZ

Hola @ CᴴᴀZ, leí el artículo y sería solo cómo hacer un OLTP con un Datamart. Okay . (pero creo que lo dijeron como una excepción) Tenga en cuenta que, como dicen, las tablas OLTP deben normalizarse para no tener inconsistencias. la normalización no es tan complicada de hacer en un esquema ER pero es mucho más complicado para Star-Schema o Snow-Flow. Estos esquemas están hechos para facilitar una lectura en la base de datos y no en operaciones transaccionales. Es por eso que usar un Datamart como OLTP no debería ser una buena idea, incluso si es posible.
Enrique Benito Casado

16

Un almacén de datos es un TIPO de base de datos.

Además de lo que la gente ya ha dicho, los almacenes de datos tienden a ser OLAP, con índices, etc. ajustados para leer, no escribir, y los datos se desnormalizan / transforman en formas que son más fáciles de leer y analizar.

Algunas personas han dicho que las "bases de datos" son lo mismo que OLTP; esto no es cierto. OLTP, nuevamente, es un TIPO de base de datos.

Otros tipos de "bases de datos": archivos de texto, XML, Excel, CSV ..., archivos planos :-)


1
Esta es la respuesta correcta de todos ellos. Y un poco en Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

La forma más sencilla de explicarlo sería decir que un almacén de datos consta de algo más que una base de datos. Una base de datos es una colección de datos organizados de alguna manera, pero un almacén de datos está organizado específicamente para "facilitar la presentación de informes y el análisis". Sin embargo, esta no es toda la historia, ya que el almacenamiento de datos también contiene "los medios para recuperar y analizar datos, extraer, transformar y cargar datos, y para administrar el diccionario de datos también se consideran componentes esenciales de un sistema de almacenamiento de datos".

Almacén de datos


4

Base de datos : - OLTP (proceso de transacción en línea)

  • Son datos actuales, datos detallados actualizados, datos aislados relacionales planos.
  • La relación de entidad se utiliza para diseñar la base de datos.
  • Tamaño de base de datos 100 MB-GB transacción simple o requisitos

Almacén de datos

  • OLAP (proceso analítico en línea)
  • Se trata de datos históricos Esquema de estrella, esquema de nieve flexionada y galaxia
  • esquema se utiliza para diseñar el almacén de datos
  • Tamaño de base de datos 100GB-TB Mejora de la base de rendimiento de consultas para la VISUALIZACIÓN DE DATOS DE MINERÍA DE DATOS
  • Permite a los usuarios obtener una comprensión y un conocimiento más profundos sobre varios aspectos de sus datos corporativos a través del acceso rápido, consistente e interactivo a una amplia variedad de vistas posibles de los datos.

4

Data Warehouse vs Database: un data warehouse está especialmente diseñado para el análisis de datos, lo que implica leer grandes cantidades de datos para comprender las relaciones y tendencias en los datos. Se utiliza una base de datos para capturar y almacenar datos, como registrar detalles de una transacción.

Data Warehouse: cargas de trabajo adecuadas : análisis, informes, big data. Fuente de datos : datos recopilados y normalizados de muchas fuentes. Captura de datos : operaciones de escritura masiva generalmente en un programa de lote predeterminado. Normalización de datos : esquemas desnormalizados, como el esquema Star o el esquema Snowflake. Almacenamiento de datos : optimizado para la simplicidad de acceso y consultas de alta velocidad. rendimiento mediante almacenamiento en columnas. Acceso a datos : optimizado para minimizar las E / S y maximizar el rendimiento de datos.

Base de datos transaccional: cargas de trabajo adecuadas: procesamiento de transacciones. Fuente de datos : los datos capturados tal cual son de una sola fuente, como un sistema transaccional. Captura de datos : optimizado para operaciones de escritura continua, ya que hay nuevos datos disponibles para maximizar el rendimiento de las transacciones. Normalización de datos : esquemas estáticos altamente normalizados. Almacenamiento de datos : optimizado para operaciones de escritura altas en un solo bloque físico orientado a filas. Acceso a datos : grandes volúmenes de pequeñas operaciones de lectura.


1

Cualquier almacenamiento de datos para la aplicación generalmente usa la base de datos. Podría ser una base de datos relacional o ninguna base de datos sql que actualmente está en tendencia.

El almacén de datos también es una base de datos. Podemos llamar a la base de datos del almacén de datos como almacenamiento de datos especializado para fines de informes analíticos para la empresa. Estos datos se utilizan para la decisión comercial clave.

Los datos organizados ayudan a informar y tomar decisiones comerciales de manera efectiva.


1

Base de datos:

Utilizado para el procesamiento transaccional en línea (OLTP).

  • Orientado a la transacción.
  • Aplicación orientada.
  • Datos actuales.
  • Datos detallados
  • Datos escalables
  • Muchos usuarios, administradores / operacionales.
  • Tiempo de ejecución: corto.

Almacén de datos:

Utilizado para el procesamiento analítico en línea (OLAP).

  • Análisis orientado.
  • Sujeto orientado.
  • Información histórica.
  • Datos agregados.
  • Datos estáticos
  • No muchos usuarios, gerente.
  • Tiempo de ejecución: largo.

1

Un Data Warehousing (DW) es un proceso para recopilar y administrar datos de diversas fuentes para proporcionar información comercial significativa. Un almacén de datos generalmente se usa para conectar y analizar datos comerciales de fuentes heterogéneas. El almacén de datos es el núcleo del sistema de BI creado para el análisis de datos y la generación de informes.


0

La fuente para el almacén de datos puede ser un grupo de bases de datos, porque las bases de datos se utilizan para el proceso de transacciones en línea, como mantener los registros actuales ... pero en el almacén de datos almacena datos históricos que son para el proceso analítico en línea.


0

Un almacén de datos es un tipo de estructura de datos generalmente alojado en una base de datos. El Data Warehouse se refiere al modelo de datos y a qué tipo de datos se almacenan allí: datos que se modelan (modelo de datos) para servir a un propósito analítico.

Una base de datos se puede clasificar como cualquier estructura que alberga datos. Tradicionalmente, sería un RDBMS como Oracle, SQL Server o MySQL. Sin embargo, una base de datos también puede ser una base de datos NoSQL como Apache Cassandra, o un MPP columnar como AWS RedShift.

Verá que una base de datos es simplemente un lugar para almacenar datos; Un almacén de datos es una forma específica de almacenar datos y tiene un propósito específico, que es atender consultas analíticas.

OLTP vs OLAP no le dice la diferencia entre un DW y una base de datos, tanto OLTP como OLAP residen en bases de datos. Simplemente almacenan datos de una manera diferente (diferentes metodologías de modelo de datos) y sirven para diferentes propósitos (OLTP: registrar transacciones, optimizado para actualizaciones; OLAP: analizar información, optimizado para lecturas).


-1

Ver en palabras simples: Dataware -> Datos enormes usando Analítico / almacenamiento / copia y Análisis. Base de datos -> Operación CRUD con datos de uso frecuente.

Dataware house es un tipo de almacenamiento que no está utilizando a diario y la base de datos es algo que está tratando con frecuencia.

P.ej. Si solicitamos un estado de cuenta bancario, nos da los últimos 3/4/6 / más meses porque está en la base de datos. Si desea más que eso, se almacena en la casa de Dataware.


-1

Ejemplo: una casa vale $100,000, y se está apreciando $1000por año.

Para realizar un seguimiento del valor actual de la vivienda, utilizaría una base de datos, ya que el valor cambiaría cada año.

Tres años después, podría ver el valor de la casa que es $103,000.

Para realizar un seguimiento del valor histórico de la vivienda, debe utilizar un almacén de datos, ya que el valor de la vivienda debe ser

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.