Neo4j vs OrientDB vs Titán


13

Estoy trabajando en un proyecto de ciencia de datos relacionado con la minería de relaciones sociales y necesito almacenar datos en algunas bases de datos de gráficos. Inicialmente elegí Neo4j como la base de datos. Pero parece que Neo4j no escala bien. La alternativa que descubrí son Titan y oriebtDB. He pasado por esta comparación en estas tres bases de datos, pero me gustaría obtener más detalles sobre estas bases de datos. Entonces, ¿podría alguien ayudarme a elegir el mejor? Principalmente me gustaría comparar el rendimiento, el escalado, la documentación en línea / tutoriales disponibles, el soporte de la biblioteca Python, la complejidad del lenguaje de consulta y el soporte del algoritmo gráfico de estas bases de datos. ¿También hay otras buenas opciones de base de datos?


1
Considere también Graphlab (basado en Python): graphlab.com/products/create/overview.html Aquí también hay una buena publicación de blog al respecto: bugra.github.io/work/notes/2014-04-06/… No puedo sin embargo, te ayudaré con la discusión de Titan vs oriebtDB. Esperemos que alguien intervenga con eso.
nfmcclure

También es posible usar Spark y GraphX
sheldonkreger

Este artículo muestra algunos detalles sobre la escalabilidad, una ventaja especial para Titan. groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
Henry H.

2
No, no es; GraphX ​​no es una base de datos.
Emre

Como esto fue hace un par de meses, supongo que progresaste un poco. ¿Por qué no agregar su propia respuesta (aquí o en otro lugar?)
Jayan

Respuestas:


1

Creo que es posible que tenga que tener en cuenta las líneas generales de datos y las líneas de aprendizaje automático. Para lo cual necesita un marco robusto para mover datos entre almacenamiento tipo tabla y gráfico, aparte del potente procesamiento distribuido. Según tengo entendido, Spark GraphX ​​promete construir estas tuberías. Vale la pena ver la charla de Joseph Gonzalez (uno de los creadores de GraphLab de CMU) en GraphX ​​en YouTube.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.