爬虫开源:webBee-为乐趣而生的web垂直爬虫框架

XavNava 8年前
   <h2>webBee 为乐趣而爬</h2>    <ul>     <li> <p>webBee 基于 jdk8 是一个持续成长的 垂直爬虫框架 项目</p> </li>     <li> <p>webBee 遵循 MIT 开源协议</p> </li>     <li> <p>webBee 是一个不错的java进阶项目</p> </li>     <li> <p>欢迎大家贡献代码,如果觉得这个项目不错,请为它 点赞</p> </li>    </ul>    <h3>演示站点</h3>    <ul>     <li><a href="/misc/goto?guid=4959747806455718304" rel="nofollow,noindex">http://gitrue.com</a> (备案成功,开发中)</li>    </ul>    <h3>设计初衷</h3>    <ul>     <li>设计简洁,面向接口</li>     <li>配置简单,明了</li>     <li>一次配置,自动匹配</li>    </ul>    <h3>涉及技术栈</h3>    <ul>     <li>httpcomponents</li>     <li>jsoup</li>     <li>redis</li>     <li>代理</li>     <li>多线程</li>    </ul>    <h3>即将完善的内容</h3>    <ul>     <li>分布式爬取</li>     <li>代理接口</li>     <li>通过配置智能寻找目标 url</li>     <li>图片、视频的处理</li>     <li>可对 熊猫tv 、 斗鱼tv 等弹幕网站弹幕监听分析</li>     <li>制作一个炫酷的官网实例</li>    </ul>    <h3>开源协议</h3>    <p><a href="/misc/goto?guid=4959747806549094907" rel="nofollow,noindex">MIT</a></p>    <p> </p>    <p>项目主页:<a href="http://www.open-open.com/lib/view/home/1492743208049">http://www.open-open.com/lib/view/home/1492743208049</a></p>    <p> </p>