ArangoDB、MongoDB和Neo4j性能比较

jopen 10年前

原文 http://www.infoq.com/cn/news/2015/06/ArangoDB-MongoDB-Neo4j

Claudius Weinberger是 ArangoDB 的首席执行官。在他看来，原生多模型数据库是指数据库引擎兼有文档、图和键/值数据模型，提供了涵盖三种模型的统一查询语言和API，并允许在单个查询中混合使用三种模型。他认为，多模型数据库可以与文档存储及图数据库（比如， MongoDB 、 Neo4j ）一较高下。为了支持这个观点，其团队对ArangoDB、MongoDB和Neo4j进行了性能测试。近日，他发表了一篇博文，介绍测试过程和结果。

测试所用的数据集是一个社交网络快照，由斯坦福大学的 SNAP 提供，其中包含160多万个顶点（代表个人资料）和3000多万条边（代表朋友关系）。他们用顶点数据做文档数据库测试，用顶点和边的综合数据做图数据库测试。测试场景如下：

单次读：单文档（个人资料）读取（10万次）；
单次写：单文档写入（10万次）；
聚合：计算社交网络的年龄分布，即每个年龄出现多少次；
相邻顶点：为500个顶点查找直接相邻顶点以及相邻顶点的相邻顶点；
最短路径：在一个高度连通的社交图中查找19条最短路径。

其中，所有数据库都执行相同的操作，所有测试用例都是用JavaScript实现，在node.js中运行。

测试结果以ArangoDB的吞吐量指标为基准，百分比越小表明吞吐量越高，相反，百分比越高表明吞吐量越低：

ArangoDB、MongoDB和Neo4j性能比较

可以看出，测试结果支持Weinberger的观点。MongoDB的单文档读/写更快，但ArangoDB的聚合和查找相邻顶点效率更高。由于在MongoDB中测试最短路径查询需要完全在客户端实现，所以他们没有对MongoDB做这项测试。令Weinberger吃惊的是，Neo4j并没有在查找相邻顶点的测试中胜出。

在Hacker News上，部分网友对测试的客观性提出了质疑。网友harunurhan提出：

你们确定对Neo4j或MongoDB进行了与ArangoDB同等程度的调优？而且，我不喜欢一家公司发表自家产品与其它产品的评测文章。虽然，许多文章信息丰富且客观，但我一律将它们视为市场营销/广告文章。

对此，网友neunhoef（来自ArangoDB的Max）答复说：

我们已经花费了相当大的精力来对每一种数据库进行调优。但显然，与其它数据库相比，我们更了解自己的产品。不过，我们已经号召更了解其它产品的人（参与进来），调查将一直开放，任何人都可以做出贡献及提出改进建议。

网友bhouston则表示：

我认为，要做到客观，唯一的方式是提供一项测试，然后给每个DB提供商机会，让他们调整数据库和查询，以便优化性能。

对此，网友porker提醒道：

据我所知，测试是开源的，原始结果也在那里，也欢迎贡献。

感兴趣的读者可以访问该测试的 GitHub页面，或者参与 HN的讨论。

ArangoDB、MongoDB和Neo4j性能比较

相关资讯