Para agregar con la otra respuesta, el registro sigue siendo un caso de uso importante, así como las búsquedas, pero ahora las métricas y los análisis son cada vez más importantes.
Creo que esta publicación resume los cambios en el mercado que están generando nuevos casos de uso para Big Data. Todo lo que realmente necesita saber sobre las bases de datos de código abierto
Con el advenimiento de la Web 2.0, las páginas web estáticas se han vuelto dinámicas y las redes sociales nos rodean. Todos están tuiteando, publicando, blogueando, vlogueando, compartiendo fotos, chateando y comentando. El Internet de las cosas (IoT) está emergiendo: una red de dispositivos conectados que crece e intercambia rápidamente datos, como sensores y dispositivos inteligentes. Hay algunos buenos ejemplos aquí.
En total, esto genera enormes cantidades de datos nuevos que las empresas desean absorber y utilizar para mantenerse a la vanguardia, para proporcionar características tales como recomendaciones de productos y una mejor experiencia del cliente. Los datos se pueden analizar en busca de patrones para aplicaciones tales como detección de fraude y análisis de comportamiento. Gran parte de los datos nuevos no están estructurados, lo que significa que no pueden almacenarse de forma ordenada en una base de datos tabular.
Imagínese tratar de diseñar una base de datos para almacenar datos sobre sus compras de comestibles: lo que le gusta, con qué frecuencia lo compra, si prefiere leche o crema con su café. Se necesitan nuevos tipos de bases de datos para almacenar los nuevos datos, y deben ser no relacionales e idealmente de bajo costo. ¿Suena alguna campana? No es relacional como en NoSQL y de bajo costo como en código abierto.
Uno de los arquitectos de Elasticsearch con los que hablé dijo que el 80% de los datos con los que Elasticsearch trabaja en las empresas no está estructurado, mientras que el 20% está estructurado. Son los datos no estructurados que las empresas están buscando para descubrir patrones de datos raros o inusuales. También están utilizando Elasticsearch para monitorear patrones de datos. Por ejemplo, un minorista importante está haciendo un seguimiento en tiempo real con Elasticsearch para garantizar suministros de dinero adecuados en las tiendas para que las personas puedan cobrar cheques en los días de pago.
En mi propia experiencia con nuestro caso de uso de búsqueda, no solo utilizamos búsquedas difusas, sino que evolucionó a búsquedas rápidas y de autocompletado. Por lo que he visto, una vez que comienza a trabajar con Elasticsearch, comienza a evolucionar hacia otros casos de uso que complementan lo que ya tiene implementado. Ahora que hemos establecido a Elasticsearch como un motor de búsqueda difuso en nuestra empresa, ahora tenemos otros equipos que buscan análisis y métricas para el registro.
Aquí hay algunos recursos adicionales que profundizan en este tema: