基于分布式技术的Web分析处理:Spindle
jopen
10年前
采用Scala, Spark, and Parquet技术实现的下一代Web分析处理。
Spindle 是来自Adobe研究院的开源项目,是构建在 Spark 上的Web日志分析查询。通过 Spray 实现的多线程 HTTP 接口来输出查询结果。查询是通过加载来自 Apache Parquet 的 HDFS 柱状存储格式。