p2pspider - DHT Crawler + BT Client = P2P Spider
jopen
9年前
介绍
p2pspider 是一个 DHT 爬虫 + BT Client 的结合体, 从全球 DHT 网络里"嗅探"人们正在下载的资源, 并把资源的metadata
(种子的主要信息)从 远程 BT 客户端下载, 并生成资源磁力链接. 通过磁力链接, 你就可以下载到资源文件.
用途
你可以使用 p2pspider 打造私人种子库, 也拿它做资源数据挖掘与分析.
安装
git clone https://github.com/Fuck-You-GFW/p2pspider
使用
请确保你的node版本是4.X.X
. 初次使用前, 请执行npm install
安装依赖包. 执行node example.js
便可运行程序. 执行后, 需要等待一段时间才会有数据输出, 等待多久看你的网络环境. 建议放在公网主机上运行, 在局域网里几乎没效果, 最好是国外的.
定制
你可以修改example.js
文件对爬取到的数据进行处理/保存. 详情请看example.js
的例子, 很简单滴.
待做
- 完全 ES6 化
- 效率优化
- 数据保存
- 跨平台 GUI 化
- 数据共享
- 资源下载
- 视频流媒体播放
目标
打造成人人都能用的神器, 可以用它搜索种子; 下载资源; 共享数据库; 如果是视频, 可边下载边播放; 打造成分布式快播是可以有滴. :)
感谢
在开发这个项目时, 从 bittorrent-protocol 和 ut_metadata 借鉴了一些实现代码. 非常感谢其作者 @feross 指点迷津.
交流
如果你对此项目感兴趣, 不管你是不是开发者, 都可加 QQ 群(145234507)进行实时交流. 虽然 QQ 群看起来很 Low, 但不得不说, 特别适合快速交流.
提醒
不要拿这个爬虫爬取的数据分享到互联网, 因为很多敏感资源; 你懂滴资源; 侵权资源. 否则后果自负喔.
许可证
MIT