trim-html:NodeJS的HTML文本截取库(自动生成正文摘要)
n7w77
10年前
原文 http://ourjs.com/detail/550a49521e8c708516000008
trim-html
可以截取HTML字符串,并不破坏打断HTML标签。
注* 网站内容大多基于HTML文本,传统的字符串截取会破坏HTML标签的结构,此库对于自动生成网站内容摘要十分有帮助。
安装
npm install trim-html
引用
var trimHtml = require('trim-html');
使用
var trimmed = trimHtml(html);
参数
- limit 截取字符个数(默认为100)
- preserveTags 去除HTML标签(默认为false)
- sufix 会加到后辍的字符串
- moreLink 全文链接
示例
var html = '<div><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit,sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p><p>Utenim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquipex ea commodo consequat. </p><p>Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. </p><p>Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.</p></div>'; var trim = trimHtml(html, { limit: 200 }); // 返回对象 { html: '<div><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p><p>Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut... </p></div>', more: true // 标识是否还有更多内容 }