0推荐
54K 浏览

Objective-C写的HTML5解析引擎:OCGumbo

OCGumbo是一个Objective-C写的HTML5解析引擎,基于Google gumbo开源项目。 OCGumbo除了基础的解析功能外,最大的特色是对增加了类似JQuery的查询功能。
jopen 11年前   
0推荐
15K 浏览

.NET平台下,一个高效的从Html中提取正文的工具 - Html2Article

.NET平台下,一个高效的从Html中提取正文的工具。 正文提取采用了基于文本密度的提取算法,支持从压缩的Html文档中提取正文,每个页面平均提取时间为10ms,正确率到95%以上。
0推荐
75K 浏览

HTML解析库:goquery

goquery是一个使用go语言写成的HTML解析库,可以让你像jQuery那样的方式来操作DOM文档。
jopen 12年前   
0推荐
53K 浏览

Gog语言开发的HTML解析器:go-html-transform

go-html-transform是基于Go语言实现的一个HTML解析器,这个库提供一种使用CSS选择器查询的方式来解析、scrape和转换HTML5页面。
jopen 12年前   
0推荐
78K 浏览

Java操作Html文档利器---Jsoup

Jsoup就是java中用来操作html文档的一个第三方类库。
jopen 12年前   
0推荐
28K 浏览

Objective-C编写的简易 HTML 解析器:Objective-C-HMTL-Parser

Objective-C-HMTL-Parser 是一个用 ObjectiveC 编写的简易 HTML 解析器。
0推荐
60K 浏览

JS的HTML/XML/RSS解析器 - NodeHtmlParser

node-htmlparser 是一个 JavaScript 的 HTML/XML/RSS 解析器。
jopen 13年前   
0推荐
52K 浏览

纯JavaScript的HTML解析器 Pure JavaScript HTML Parser

这是一个纯 JavaScript 的 HTML 文档解析器
jopen 13年前   
0推荐
23K 浏览

Java的HTML解析包 jScraper

jScraper 提供了简单的接口用来解析HTML文本,它将HTML文本转成Java的对象。
jopen 13年前   
0推荐
14K 浏览

HTML 解析器 Jericho

Jericho HTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,而过滤掉任何无法识别的或无效的HTML 。它也提供高层次的HTML表单操作函数。
jopen 13年前   
0推荐
21K 浏览

HTML 解析类库 MozillaParser

MozillaParser 是一个 Java 的HTML 解析类库,基于 mozilla 的html 解析器,提供了Java类到 Mozilla类的一个桥接,输入一个HTML文本,输出一个 Ja...
jopen 13年前   
0推荐
52K 浏览

网页缩略图生成类库 Scrender

Scrender是一个用来生成网页缩略图的Java类库,基于SWT开发。它实质上是调用本地浏览器引擎对要进行截图的网站进行渲染,然后保存该网页的缩略图。
jopen 13年前   
0推荐
58K 浏览

JavaScript的HTML解析器 node-htmlparser

node-htmlparser 是一个 JavaScript 的 HTML 文档解析器。
jopen 13年前   
0推荐
13K 浏览

PHP的HTML解析 wiseparser

wiseparser 是一个 PHP 语言用来解析 HTML 文档的开发包。
jopen 13年前   
0推荐
93K 浏览

生成HTML页面的Python模块 PyH

PyH 是一个用来生成HTML页面的Python模块,使用面向对象的方式,HTML的标签都会对应一个Python的对象,输出的HTML文档排版良好,易于阅读。
jopen 13年前   
0推荐
22K 浏览

xhtmlrenderer

解析HTML与XML,并应用CSS样式,然后输出成图片,PDF(通过iText)等格式。
jopen 13年前   
0推荐
23K 浏览

Python的HTML文档解析 tagparser

很多人需要提取网页的一些内容, 可以利用正则表达式提取,也可以用beautifulsoap等工具. 正则表达式方法速度快,缺点是不好找到匹配的正则. 其他类似beautiful的工具因为要全面分...
jopen 13年前   
0推荐
25K 浏览

HTML解析器 TagSoup

TagSoup 是一个Java开发符合SAX的HTML解析器。
jopen 13年前   
0推荐
17K 浏览

HTML解析器 JoyHTML

JoyHTML的目的是解析HTML文本当中的链接和正文,利用超链接密度法为主要判断依据的标记窗算法,采用DOM树解析模式。
jopen 13年前   
0推荐
14K 浏览

HTML解析器 VietSpider

VietSpider HTMLParser 是一个纯 Java 的 HTML DOM 解析器,支持 HTML 4.0.1 。具有语法检查、自动关闭元素,可以处理一些匹配错误的元素,执行效率高。
jopen 13年前   
1 2 3 4

经验分享,提升职场影响力

投稿

热门问答

    热门文档