trim-html:NodeJS的HTML文本截取库(自动生成正文摘要)

n7w77 10年前

原文  http://ourjs.com/detail/550a49521e8c708516000008

trim-html

可以截取HTML字符串,并不破坏打断HTML标签。

注* 网站内容大多基于HTML文本,传统的字符串截取会破坏HTML标签的结构,此库对于自动生成网站内容摘要十分有帮助。

安装

npm install trim-html

引用

var trimHtml = require('trim-html');

使用

var trimmed = trimHtml(html);

参数

  • limit 截取字符个数(默认为100)
  • preserveTags 去除HTML标签(默认为false)
  • sufix  会加到后辍的字符串
  • moreLink 全文链接

示例

var html = '<div><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit,sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p><p>Utenim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquipex ea commodo consequat. </p><p>Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. </p><p>Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.</p></div>';    var trim = trimHtml(html, { limit: 200 });      // 返回对象  {     html: '<div><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit,     sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p><p>Ut     enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut...     </p></div>',     more: true // 标识是否还有更多内容  }

项目地址: https://github.com/brankosekulic/trimHtml

</div>