Golang开源:Poseidon - 360 出品的日志搜索平台

acfc4096 8年前
   <h2>波塞冬:Poseidon</h2>    <p>波塞冬,是希腊神话中的海神,在这里是寓意着海量数据的主宰者。</p>    <p>Poseidon 系统是一个日志搜索平台,可以在数百万亿条、数百PB大小的日志数据中快速分析和检索特定字符串。 360公司是一个安全公司,在追踪 APT(高级持续威胁)事件时,经常需要在海量的历史日志数据中检索某些信息, 例如某个恶意样本在某个时间段内的活动情况。在 Poseidon 系统出现之前,都是写 Map/Reduce 计算任务在 Hadoop 集群中做计算, 一次任务所需的计算时间从数小时到数天不等,大大制约了 APT 事件的追踪效率。 Poseidon 系统就是为了解决这个需求,能在几秒钟内从数百万亿条规模的数据集中找出我们需要的数据,大大提高工作效率; 同时,这些数据不需要额外存储,仍然存放在Hadoop集群中,节省了大量存储和计算资源。该系统可以应用于任何结构化或非结构化海量(从万亿到千万亿规模)数据的查询检索需求。</p>    <h2><a href="/misc/goto?guid=4959728758572377273" rel="nofollow,noindex">Quick Start</a></h2>    <h2>所用技术</h2>    <ul>     <li>倒排索引:构建日志搜索引擎的核心技术</li>     <li>Hadoop:用于存放原始数据和索引数据,并用来运行Map/Reduce程序来构建索引</li>     <li>Java:构建索引时是用Java开发的Map/Reduce程序</li>     <li>Golang:检索程序是用Golang开发的</li>     <li>Redis/Memcached:用于存储 <em>Meta</em> 元数据信息</li>    </ul>    <h2>目录结构</h2>    <h3>builder</h3>    <p>这里存放的是数据生成工具</p>    <ul>     <li>doc :将原始日志转换为Poseidon格式的数据。</li>     <li>docmeta :将Doc相关的元数据信息写入NoSQL库中的工具。</li>     <li>index :从原始日志生成倒排索引数据的程序工具,是Hadoop 的 Map/Reduce 作业程序。</li>     <li>indexmeta :将倒排索引的元数据写入NoSQL库中的工具。</li>    </ul>    <h3>common</h3>    <p>目前仅仅用来存放该项目中用到的 protobuf 定义</p>    <h3>docs</h3>    <p>存放了相关的技术文档。</p>    <ul>     <li>项目设计文档      <ul>       <li><a href="/misc/goto?guid=4959728758663101326" rel="nofollow,noindex">设计思路和原理(2016上海QCon大会分享PPT)</a></li>       <li><a href="/misc/goto?guid=4959728758746257585" rel="nofollow,noindex">如何构建倒排索引</a></li>       <li><a href="/misc/goto?guid=4959728758839129731" rel="nofollow,noindex">术语解释</a></li>       <li><a href="/misc/goto?guid=4959728758923113915" rel="nofollow,noindex">构建倒排索引时所需的配置文件模板的说明</a></li>       <li><a href="/misc/goto?guid=4959728758572377273" rel="nofollow,noindex">快速开始</a></li>      </ul> </li>     <li>微服务      <ul>       <li><a href="/misc/goto?guid=4959728759017202144" rel="nofollow,noindex">HDFS数据读取微服务 hdfsreader</a></li>       <li><a href="/misc/goto?guid=4959728759101022256" rel="nofollow,noindex">ID生成中心微服务 idgenerator</a></li>       <li><a href="/misc/goto?guid=4959728759188441511" rel="nofollow,noindex">元数据存取微服务 meta</a></li>       <li><a href="/misc/goto?guid=4959728759270742916" rel="nofollow,noindex">核心搜索引擎服务 searcher</a></li>       <li><a href="/misc/goto?guid=4959728759368673564" rel="nofollow,noindex">搜索引擎代理服务 proxy</a></li>      </ul> </li>    </ul>    <h3>service</h3>    <p>这里存放的是各个HTTP微服务服务的程序</p>    <ul>     <li>hdfsreader :读取HDFS中某个文件路径的一段数据。      <ul>       <li>/service/hdfsreader</li>      </ul> </li>     <li>idgenerator :全局的ID生成中心      <ul>       <li>/service/idgenerator</li>      </ul> </li>     <li>meta :针对存放Meta信息的NoSQL提供统一的HTTP接口服务      <ul>       <li>/service/meta/business/doc/get : DocGzMeta 信息查询接口</li>       <li>/service/meta/business/doc/set : DocGzMeta 信息更新接口</li>       <li>/service/meta/business/index/get : InvertedIndexGzMeta 信息查询接口</li>       <li>/service/meta/business/index/set : InvertedIndexGzMeta 信息更新接口</li>      </ul> </li>     <li>searcher :Poseidon搜索引擎的核心检索服务</li>     <li>proxy :searcher的一个代理,并能实现跨时间的查询服务</li>     <li>allinone : 为简化部署,将 idgenerator/meta/searcher/proxy 四个微服务集成在一个进程中,提供统一的服务接口</li>    </ul>    <p> </p>    <p> </p>