Con Hadoop y CouchDB en todos los blogs y noticias relacionadas, ¿qué es un almacenamiento (motor) tolerante a fallas distribuidas que realmente funciona?
- CouchDB en realidad no tiene ninguna función de distribución incorporada, que yo sepa, simplemente falta el pegamento para distribuir automáticamente las entradas o incluso bases de datos completas.
- Hadoop parece ser muy utilizado, al menos tiene buena prensa, pero aún tiene un único punto de falla: el NameNode. Además, solo se puede montar a través de FUSE, entiendo que HDFS no es realmente el objetivo principal de Hadoop
- GlusterFS tiene un concepto de nada compartido, pero últimamente leí varias publicaciones que me llevan a la opinión de que no es tan estable
- Lustre también tiene un único punto de falla, ya que utiliza un servidor de metadatos dedicado
- Ceph parece ser el jugador elegido, pero la página de inicio dice que todavía está en sus etapas alfa.
Entonces, la pregunta es qué sistema de archivos distribuido tiene el siguiente conjunto de características (sin un orden particular):
- Compatible con POSIX
- Fácil adición / eliminación de nodos
- concepto de nada compartido
- se ejecuta en hardware barato (procesadores de clase AMD Geode o VIA Eden)
- autenticación / autorización incorporada
- un sistema de archivos de red (me gustaría poder montarlo simultáneamente en diferentes hosts)
Agradable tener:
- archivos localmente accesibles: puedo bajar un nodo y montar la partición con un sistema de archivos local estándar (ext3 / xfs / lo que sea ...) y aún acceder a los archivos
Estoy no en busca de aplicaciones alojadas, más bien algo que me permitirá tomar decir 10GB de cada una de nuestras cajas de hardware y tener esa almacenamiento disponible en nuestra red, fácilmente montable en una multitud de los ejércitos.