Java 全文本搜索引擎 Egothor
fmms
13年前
<div id="p_fullcontent" class="detail"> <p>Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。</p> <h3>主要特性</h3> <ul> <li>采用Java开发,实现跨平台支持</li> <li>快速索引更新的新dynamization算法</li> <li>支持64-bit 内核</li> <li>支持事务(ACID)</li> <li>增量更新</li> <li>查询可以在并行的方式解决</li> <li>能够识别大部分相似的文件:HTML, PDF, PS, and Microsoft's DOC, and XLS.</li> <li>高容量的机器人,它支持的robots.txt建议。</li> <li>使用最好的压缩方法,如:Golomb, Elias-Gamma, Block coding.</li> <li>基于扩展布尔模型可以作为矢量或布尔模型。</li> <li>通用词干可以处理任何语言。</li> </ul> <p><strong>项目主页:</strong><a href="http://www.open-open.com/lib/view/home/1325429725421" target="_blank">http://www.open-open.com/lib/view/home/1325429725421</a></p> </div>