轻量化易用网络爬虫Gecco v1.2.4 发布
jopen 8年前
<p style="text-align: center;"><img alt="" src="https://simg.open-open.com/show/185b899fb2b77b84ff7b3ecfaa455c4c.png" /></p> <p> Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。同时Gecco基于十分开放的MIT开源协议。</p> <p> </p> <h2>更新日志</h2> <ul> <li>修复GeccoEngine生命周期EventListener,onStart无效的bug</li> <li>修改图片自动下载方式,对<a href="/misc/goto?guid=4958993747789653487">@Image</a>提供单独的渲染器ImageFieldRender</li> <li>修复大规模爬取时有时httpclient阻塞的bug</li> <li>优化异常处理,RenderException将不会中断渲染和pipeline处理,而是记录日志</li> <li>升级guava到最新的19.0版本</li> </ul> <p> </p> <h2>下载</h2> <ul> <li><a href="/misc/goto?guid=4958993747901953879" rel="nofollow"><strong>Source code</strong> (zip)</a></li> <li><a href="/misc/goto?guid=4958993748025653039" rel="nofollow"><strong>Source code</strong> (tar.gz)</a></li> </ul> <p> </p> <p>本站原创,转载时保留以下信息:<br /> 本文转自:深度开源(open-open.com)<br /> 原文地址:<a href="http://www.open-open.com/news/view/51ed745">http://www.open-open.com/news/view/51ed745</a></p>