HTML转Markdownd的Python库 :html2text
jopen
12年前
html2text 是一个 Python 脚本能够将 HTML 转成干净,易于阅读的 Markdown 格式。
示例代码:
import html2text h = html2text.HTML2Text() h.ignore_links = True print h.handle("<p>Hello, <a href='http://earth.google.com/'>world</a>!")