Resumen (TL; DR)
Actualizado el 3 de junio de 2017
Redis es más poderoso, más popular y mejor soportado que memcached. Memcached solo puede hacer una pequeña fracción de las cosas que Redis puede hacer. Redis es mejor incluso cuando sus características se superponen.
Para cualquier cosa nueva, use Redis.
Memcached vs Redis: Comparación directa
Ambas herramientas son almacenes de datos potentes, rápidos y en memoria que son útiles como caché. Ambos pueden ayudar a acelerar su aplicación almacenando en caché los resultados de la base de datos, fragmentos HTML o cualquier otra cosa que pueda ser costosa de generar.
Puntos a considerar
Cuando se usan para lo mismo, así es como se comparan usando los "Puntos a considerar" de la pregunta original:
- Velocidad de lectura / escritura : ambos son extremadamente rápidos. Los puntos de referencia varían según la carga de trabajo, las versiones y muchos otros factores, pero generalmente muestran que los redis son tan rápidos o casi tan rápidos como memcached. Recomiendo redis, pero no porque memcached es lento. No es.
- Uso de memoria : Redis es mejor.
- memcached: especifica el tamaño de la memoria caché y, a medida que inserta elementos, el daemon crece rápidamente un poco más que este tamaño. En realidad, nunca hay una manera de reclamar nada de ese espacio, salvo reiniciar memcached. Todas sus claves podrían expirar, podría vaciar la base de datos y aún usaría la porción completa de RAM con la que la configuró.
- redis: la configuración de un tamaño máximo depende de usted. Redis nunca usará más de lo necesario y le devolverá la memoria que ya no usa.
- Almacené 100,000 ~ 2KB cadenas (~ 200MB) de oraciones aleatorias en ambos. El uso de RAM de Memcached creció a ~ 225 MB. El uso de Redis RAM aumentó a ~ 228 MB. Después de enjuagar ambos, redis bajó a ~ 29MB y memcached se quedó en ~ 225MB. Son igualmente eficientes en la forma en que almacenan datos, pero solo uno es capaz de recuperarlos.
- Volcado de E / S de disco : una clara victoria para redis, ya que lo hace de forma predeterminada y tiene una persistencia muy configurable. Memcached no tiene mecanismos para descargar en el disco sin herramientas de terceros.
- Escalado : ambos le brindan mucho espacio para la cabeza antes de que necesite más de una instancia como caché. Redis incluye herramientas para ayudarlo a ir más allá, mientras que memcached no.
memcached
Memcached es un servidor de caché volátil simple. Le permite almacenar pares clave / valor donde el valor se limita a ser una cadena de hasta 1 MB.
Es bueno en esto, pero eso es todo lo que hace. Puede acceder a esos valores por su clave a una velocidad extremadamente alta, a menudo saturando la red disponible o incluso el ancho de banda de la memoria.
Cuando reinicia memcached, sus datos desaparecen. Esto está bien para un caché. No deberías almacenar nada importante allí.
Si necesita un alto rendimiento o alta disponibilidad, hay herramientas, productos y servicios de terceros disponibles.
redis
Redis puede hacer los mismos trabajos que Memcached, y puede hacerlos mejor.
Redis también puede actuar como caché . También puede almacenar pares clave / valor. En redis incluso pueden tener hasta 512 MB.
Puede desactivar la persistencia y felizmente perderá sus datos al reiniciar también. Si quieres que tu caché sobreviva se reinicia, también te permite hacerlo. De hecho, ese es el valor predeterminado.
También es súper rápido, a menudo limitado por el ancho de banda de la red o la memoria.
Si una instancia de redis / memcached no es suficiente rendimiento para su carga de trabajo, redis es la opción clara. Redis incluye soporte de clúster y viene con herramientas de alta disponibilidad ( redis-sentinel ) directamente "en la caja". En los últimos años, redis también se ha convertido en el claro líder en herramientas de terceros. Empresas como Redis Labs, Amazon y otras ofrecen muchas herramientas y servicios de redis útiles. El ecosistema alrededor de redis es mucho más grande. El número de implementaciones a gran escala ahora es probablemente mayor que para memcached.
El superconjunto Redis
Redis es más que un caché. Es un servidor de estructura de datos en memoria. A continuación encontrará una descripción general rápida de las cosas que Redis puede hacer más allá de ser un simple caché de clave / valor como memcached. La mayoría de las características de redis son cosas que Memcached no puede hacer.
Documentación
Redis está mejor documentado que memcached. Si bien esto puede ser subjetivo, parece ser cada vez más cierto todo el tiempo.
redis.io es un recurso fantástico de fácil navegación. Le permite probar redis en el navegador e incluso le ofrece ejemplos interactivos en vivo con cada comando en los documentos.
Ahora hay dos veces más resultados de stackoverflow para redis que memcached. El doble de resultados de Google. Ejemplos más fácilmente accesibles en más idiomas. Desarrollo más activo. Desarrollo más activo del cliente. Es posible que estas mediciones no signifiquen mucho individualmente, pero en combinación pintan una imagen clara de que el soporte y la documentación para redis es mayor y mucho más actualizado.
De forma predeterminada, redis conserva sus datos en el disco utilizando un mecanismo llamado captura de pantalla. Si tiene suficiente RAM disponible, puede escribir todos sus datos en el disco con casi ninguna degradación del rendimiento. ¡Es casi gratis!
En el modo de instantánea, existe la posibilidad de que un bloqueo repentino pueda provocar una pequeña cantidad de datos perdidos. Si realmente necesita asegurarse de que nunca se pierdan datos, no se preocupe, redis también lo respalda con el modo AOF (Anexar solo archivo). En este modo de persistencia, los datos se pueden sincronizar con el disco a medida que se escriben. Esto puede reducir el rendimiento máximo de escritura a la velocidad con que su disco pueda escribir, pero aún así debería ser bastante rápido.
Hay muchas opciones de configuración para ajustar la persistencia si es necesario, pero los valores predeterminados son muy razonables. Estas opciones facilitan la configuración de redis como un lugar seguro y redundante para almacenar datos. Es una base de datos real .
Muchos tipos de datos
Memcached está limitado a cadenas, pero Redis es un servidor de estructura de datos que puede servir muchos tipos de datos diferentes. También proporciona los comandos que necesita para aprovechar al máximo esos tipos de datos.
Texto simple o valores binarios que pueden tener un tamaño de hasta 512 MB. Este es el único tipo de datos redis y memcached share, aunque las cadenas de memcached están limitadas a 1 MB.
Redis le brinda más herramientas para aprovechar este tipo de datos al ofrecer comandos para operaciones bit a bit, manipulación a nivel de bit, soporte de incremento / decremento de coma flotante, consultas de rango y operaciones de teclas múltiples. Memcached no admite nada de eso.
Las cadenas son útiles para todo tipo de casos de uso, por lo que memcached es bastante útil solo con este tipo de datos.
Los hashes son algo así como un almacén de valores clave dentro de un almacén de valores clave. Se asignan entre campos de cadena y valores de cadena. Los mapas de campo-> valor utilizando un hash son un poco más eficientes en espacio que los mapas de clave-> valor utilizando cadenas regulares.
Los hashes son útiles como espacio de nombres o cuando desea agrupar lógicamente muchas claves. Con un hash puede capturar a todos los miembros de manera eficiente, expirar todos los miembros juntos, eliminar todos los miembros juntos, etc. Excelente para cualquier caso de uso en el que tenga varios pares clave / valor que necesiten agruparse.
Un ejemplo de uso de un hash es para almacenar perfiles de usuario entre aplicaciones. Un hash de redis almacenado con la ID de usuario como clave le permitirá almacenar tantos bits de datos sobre un usuario como sea necesario mientras los mantiene almacenados en una sola clave. La ventaja de usar un hash en lugar de serializar el perfil en una cadena es que puede hacer que diferentes aplicaciones lean / escriban diferentes campos dentro del perfil de usuario sin tener que preocuparse de que una aplicación anule los cambios realizados por otros (lo que puede suceder si serializa rancio datos).
Las listas de Redis son colecciones ordenadas de cadenas. Están optimizados para insertar, leer o eliminar valores de la parte superior o inferior (es decir, izquierda o derecha) de la lista.
Redis proporciona muchos comandos para aprovechar las listas, incluidos los comandos para empujar / pop elementos, empujar / pop entre listas, truncar listas, realizar consultas de rango, etc.
Las listas hacen grandes colas duraderas, atómicas. Estos funcionan muy bien para colas de trabajo, registros, memorias intermedias y muchos otros casos de uso.
Los conjuntos son colecciones desordenadas de valores únicos. Están optimizados para permitirle verificar rápidamente si hay un valor en el conjunto, agregar / eliminar valores rápidamente y medir la superposición con otros conjuntos.
Estos son excelentes para cosas como listas de control de acceso, rastreadores de visitantes únicos y muchas otras cosas. La mayoría de los lenguajes de programación tienen algo similar (generalmente llamado Conjunto). Esto es así, solo distribuido.
Redis proporciona varios comandos para administrar conjuntos. Los obvios como agregar, eliminar y verificar el conjunto están presentes. Entonces, hay comandos menos obvios como hacer estallar / leer un elemento aleatorio y comandos para realizar uniones e intersecciones con otros conjuntos.
Conjuntos ordenados ( comandos )
Los conjuntos ordenados también son colecciones de valores únicos. Estos, como su nombre lo indica, están ordenados. Están ordenados por puntuación, luego lexicográficamente.
Este tipo de datos está optimizado para búsquedas rápidas por puntaje. Obtener el más alto, más bajo o cualquier rango de valores intermedios es extremadamente rápido.
Si agrega usuarios a un conjunto ordenado junto con su puntaje alto, tiene una tabla de clasificación perfecta. A medida que lleguen nuevos puntajes altos, solo agréguelos nuevamente al conjunto con su puntaje alto y reordenará su tabla de clasificación. También es excelente para realizar un seguimiento de la última vez que los usuarios visitaron y quién está activo en su aplicación.
Almacenar valores con el mismo puntaje hace que se ordenen lexicográficamente (piense alfabéticamente). Esto puede ser útil para cosas como funciones de autocompletar.
Muchos de los comandos de conjuntos ordenados son similares a los comandos de conjuntos, a veces con un parámetro de puntuación adicional. También se incluyen comandos para administrar puntajes y consultar por puntaje.
Geo
Redis tiene varios comandos para almacenar, recuperar y medir datos geográficos. Esto incluye consultas de radio y distancias de medición entre puntos.
Técnicamente, los datos geográficos en redis se almacenan en conjuntos ordenados, por lo que este no es un tipo de datos verdaderamente separado. Es más una extensión sobre conjuntos ordenados.
Mapa de bits e HyperLogLog
Al igual que geo, estos no son tipos de datos completamente separados. Estos son comandos que le permiten tratar los datos de cadena como si fuera un mapa de bits o un hiperloglog.
Los mapas de bits son para lo que son los operadores de nivel de bits a los que me referí Strings
. Este tipo de datos fue el componente básico del reciente proyecto de arte colaborativo de reddit: r / Place .
HyperLogLog le permite usar una cantidad constante de espacio extremadamente pequeño para contar valores únicos casi ilimitados con una precisión impactante. Usando solo ~ 16 KB, podría contar eficientemente el número de visitantes únicos a su sitio, incluso si ese número es de millones.
Transacciones y Atomicidad
Los comandos en redis son atómicos, lo que significa que puede estar seguro de que tan pronto como escriba un valor para redis ese valor será visible para todos los clientes conectados a redis. No hay que esperar a que se propague ese valor. Técnicamente, memcached también es atómico, pero con redis agregando toda esta funcionalidad más allá de memcached, vale la pena señalar y de alguna manera impresionante que todos estos tipos de datos y características adicionales también sean atómicos.
Si bien no es lo mismo que las transacciones en bases de datos relacionales, redis también tiene transacciones que usan "bloqueo optimista" ( WATCH / MULTI / EXEC ).
Tubería
Redis proporciona una función llamada ' canalización '. Si tiene muchos comandos de redis que desea ejecutar, puede usar la canalización para enviarlos a redis todo a la vez en lugar de uno a la vez.
Normalmente, cuando ejecuta un comando para redis o memcached, cada comando es un ciclo de solicitud / respuesta separado. Con la canalización, redis puede almacenar en búfer varios comandos y ejecutarlos todos a la vez, respondiendo con todas las respuestas a todos sus comandos en una sola respuesta.
Esto puede permitirle lograr un rendimiento aún mayor en la importación masiva u otras acciones que involucren muchos comandos.
Pub / Sub
Redis tiene comandos dedicados a la funcionalidad pub / sub , lo que permite que redis actúe como un emisor de mensajes de alta velocidad. Esto permite que un solo cliente publique mensajes a muchos otros clientes conectados a un canal.
Redis hace pub / sub, así como casi cualquier herramienta. Los corredores de mensajes dedicados como RabbitMQ pueden tener ventajas en ciertas áreas, pero el hecho de que el mismo servidor también puede brindarle colas duraderas persistentes y otras estructuras de datos que sus cargas de trabajo de pub / sub probablemente necesiten, Redis a menudo demostrará ser la mejor y más simple herramienta para el trabajo.
Lua Scripting
Puede pensar en scripts lua como el propio SQL de redis o los procedimientos almacenados. Es más y menos que eso, pero la analogía funciona principalmente.
Tal vez tenga cálculos complejos que desea que redis realice. Tal vez no pueda permitirse que sus transacciones se reviertan y necesite garantías de que cada paso de un proceso complejo sucederá atómicamente. Estos problemas y muchos más se pueden resolver con scripts de lua.
El script completo se ejecuta atómicamente, por lo que si puede ajustar su lógica en un script lua, a menudo puede evitar meterse con transacciones de bloqueo optimistas.
Escalada
Como se mencionó anteriormente, redis incluye soporte integrado para la agrupación en clúster y se incluye con su propia herramienta de alta disponibilidad llamada redis-sentinel
.
Conclusión
Sin dudarlo, recomendaría redis sobre memcached para cualquier proyecto nuevo, o proyectos existentes que no usen memcached.
Lo anterior puede parecer que no me gusta memcached. Por el contrario: es una herramienta poderosa, simple, estable, madura y endurecida. Incluso hay algunos casos de uso en los que es un poco más rápido que redis. Me encanta memcached. Simplemente no creo que tenga mucho sentido para el desarrollo futuro.
Redis hace todo lo que Memcached hace, a menudo mejor. Cualquier ventaja de rendimiento para memcached es menor y específica para la carga de trabajo. También hay cargas de trabajo para las cuales redis será más rápido, y muchas más cargas de trabajo que redis pueden hacer que memcached simplemente no puede. Las pequeñas diferencias de rendimiento parecen menores ante el abismo gigante en la funcionalidad y el hecho de que ambas herramientas son tan rápidas y eficientes que muy bien pueden ser la última parte de su infraestructura por la que tendrá que preocuparse por escalar.
Solo hay un escenario en el que memcached tiene más sentido: donde memcached ya está en uso como caché. Si ya está almacenando en caché con memcached, siga usándolo, si cumple con sus necesidades. Es probable que no valga la pena el esfuerzo para cambiar a redis y si va a usar redis solo para el almacenamiento en caché, es posible que no ofrezca suficientes beneficios para que valga la pena su tiempo. Si memcached no satisface tus necesidades, entonces probablemente deberías pasar a redis. Esto es cierto tanto si necesita escalar más allá de memcached o si necesita funcionalidad adicional.