轻量化易用网络爬虫Gecco v1.2.0 发布
jopen 8年前
<p style="text-align: center;"><img alt="" src="https://simg.open-open.com/show/185b899fb2b77b84ff7b3ecfaa455c4c.png" /></p> <p>Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。同时Gecco基于十分开放的MIT开源协议。</p> <h2>更新日志</h2> <p>1、HttpClientDownloader保证inputstream能重复使用,<a href="/misc/goto?guid=4958991924122680414">@shangjian</a>提供修改思路<br /> 2、支持一个Before/AfterDownloader对应多个SpiderBean<br /> 3、Gecco的动态编程是新版本的核心功能,Gecco支持动态生成SpiderBean包括类,属性,注解。可以不需要预先定义SpiderBean即可完成抓取。</p> <h2>下载</h2> <ul> <li><a href="/misc/goto?guid=4958991924246389261" rel="nofollow"><strong>Source code</strong> (zip)</a></li> <li><a href="/misc/goto?guid=4958991924368562846" rel="nofollow"><strong>Source code</strong> (tar.gz)</a></li> </ul>