p2pspider - DHT Crawler + BT Client = P2P Spider

jopen 9年前

介绍

p2pspider 是一个 DHT 爬虫 + BT Client 的结合体, 从全球 DHT 网络里"嗅探"人们正在下载的资源, 并把资源的metadata(种子的主要信息)从 远程 BT 客户端下载, 并生成资源磁力链接. 通过磁力链接, 你就可以下载到资源文件.

用途

你可以使用 p2pspider 打造私人种子库, 也拿它做资源数据挖掘与分析.

安装

git clone https://github.com/Fuck-You-GFW/p2pspider

使用

请确保你的node版本是4.X.X. 初次使用前, 请执行npm install安装依赖包. 执行node example.js便可运行程序. 执行后, 需要等待一段时间才会有数据输出, 等待多久看你的网络环境. 建议放在公网主机上运行, 在局域网里几乎没效果, 最好是国外的.

定制

你可以修改example.js文件对爬取到的数据进行处理/保存. 详情请看example.js的例子, 很简单滴.

待做

  • 完全 ES6 化
  • 效率优化
  • 数据保存
  • 跨平台 GUI 化
  • 数据共享
  • 资源下载
  • 视频流媒体播放

目标

打造成人人都能用的神器, 可以用它搜索种子; 下载资源; 共享数据库; 如果是视频, 可边下载边播放; 打造成分布式快播是可以有滴. :)

感谢

在开发这个项目时, 从 bittorrent-protocolut_metadata 借鉴了一些实现代码. 非常感谢其作者 @feross 指点迷津.

交流

如果你对此项目感兴趣, 不管你是不是开发者, 都可加 QQ 群(145234507)进行实时交流. 虽然 QQ 群看起来很 Low, 但不得不说, 特别适合快速交流.

提醒

不要拿这个爬虫爬取的数据分享到互联网, 因为很多敏感资源; 你懂滴资源; 侵权资源. 否则后果自负喔.

许可证

MIT

项目地址: https://github.com/Fuck-You-GFW/p2pspider