Java 全文本搜索引擎 Egothor

fmms 13年前
     <div id="p_fullcontent" class="detail">     <p>Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。</p>     <h3>主要特性</h3>     <ul>      <li>采用Java开发,实现跨平台支持</li>      <li>快速索引更新的新dynamization算法</li>      <li>支持64-bit 内核</li>      <li>支持事务(ACID)</li>      <li>增量更新</li>      <li>查询可以在并行的方式解决</li>      <li>能够识别大部分相似的文件:HTML, PDF, PS, and Microsoft's DOC, and XLS.</li>      <li>高容量的机器人,它支持的robots.txt建议。</li>      <li>使用最好的压缩方法,如:Golomb, Elias-Gamma, Block coding.</li>      <li>基于扩展布尔模型可以作为矢量或布尔模型。</li>      <li>通用词干可以处理任何语言。</li>     </ul>     <p><strong>项目主页:</strong><a href="http://www.open-open.com/lib/view/home/1325429725421" target="_blank">http://www.open-open.com/lib/view/home/1325429725421</a></p>    </div>