百度开源的BigTable实现:Tera - 分布式表格系统

jopen 9年前

Tera实现了按行key、列和时间戳全局排序的三维数据模型,并且针对万兆网卡和SSD进行了优化,适合海量记录(万亿量级)的持久存储和高效随机访问。

特性

* 全局有序  * 热点自动分片  * 数据强一致  * 多版本,自动垃圾收集  * 按列存储,支持内存表  * 动态schema,支持稀疏表  * 表格快照  * 高效随机读写

系统依赖

使用分布式文件系统(HDFS、NFS等)持久化数据与元信息

使用zookeeper选主与协调

使用Sofa-pbrpc实现跨进程通信

API使用示例

参考wiki


项目主页:
http://www.open-open.com/lib/view/home/1426078356763