爬虫开源:webBee-为乐趣而生的web垂直爬虫框架
XavNava
7年前
<h2>webBee 为乐趣而爬</h2> <ul> <li> <p>webBee 基于 jdk8 是一个持续成长的 垂直爬虫框架 项目</p> </li> <li> <p>webBee 遵循 MIT 开源协议</p> </li> <li> <p>webBee 是一个不错的java进阶项目</p> </li> <li> <p>欢迎大家贡献代码,如果觉得这个项目不错,请为它 点赞</p> </li> </ul> <h3>演示站点</h3> <ul> <li><a href="/misc/goto?guid=4959747806455718304" rel="nofollow,noindex">http://gitrue.com</a> (备案成功,开发中)</li> </ul> <h3>设计初衷</h3> <ul> <li>设计简洁,面向接口</li> <li>配置简单,明了</li> <li>一次配置,自动匹配</li> </ul> <h3>涉及技术栈</h3> <ul> <li>httpcomponents</li> <li>jsoup</li> <li>redis</li> <li>代理</li> <li>多线程</li> </ul> <h3>即将完善的内容</h3> <ul> <li>分布式爬取</li> <li>代理接口</li> <li>通过配置智能寻找目标 url</li> <li>图片、视频的处理</li> <li>可对 熊猫tv 、 斗鱼tv 等弹幕网站弹幕监听分析</li> <li>制作一个炫酷的官网实例</li> </ul> <h3>开源协议</h3> <p><a href="/misc/goto?guid=4959747806549094907" rel="nofollow,noindex">MIT</a></p> <p> </p> <p>项目主页:<a href="http://www.open-open.com/lib/view/home/1492743208049">http://www.open-open.com/lib/view/home/1492743208049</a></p> <p> </p>