基于分布式技术的Web分析处理:Spindle

jopen 10年前

采用Scala, Spark, and Parquet技术实现的下一代Web分析处理。

Spindle 是来自Adobe研究院的开源项目,是构建在 Spark 上的Web日志分析查询。通过 Spray 实现的多线程 HTTP 接口来输出查询结果。查询是通过加载来自 Apache Parquet 的 HDFS 柱状存储格式。

基于分布式技术的Web分析处理:Spindle

基于分布式技术的Web分析处理:Spindle

项目主页:http://www.open-open.com/lib/view/home/1414633596419