Heritrix版本: Web爬虫 授权协议: 开发语言: 操作系统: 项目首页 项目文档 项目下载 0 Heritrix是一个开源,可扩展的web爬虫项目。Heritrix设计成严格按照robots.txt文件的排除指示和META robots标签。 相关项目 Heritrix 目录