开源的全文搜索服务器:Fess
jopen
11年前
FESS基于Java的全文搜索服务器。Fess采用 Seasar2 框架+ Apache Solr构建。Fess还提供了一个爬虫 S2Robot,可以抓取网络或本地文件系统上的文件,并支持多种文件格式,如MS Office,PDF和zip。
特性:
- 易于安装/配置
- 抓取网页/文件系统/ DB/ Windows共享文件夹的文件
- 支持的文档格式:MS Office, PDF,...
- 使用Apache Solr作为搜索引擎
- Support Japanese mobile devices
- Provide a browser based administative page
- Support a web page for BASIC/DIGEST/NTLM authentication
- Support a role authentication
- Support XML/JSON/JSONP format
- Provide a search log and statistics