html2text

html2text

html2text是用C ++编写的命令行实用程序,可将HTML文档转换为纯文本。
html2text是用C ++编写的命令行实用程序,可将HTML文档转换为纯文本。每个HTML文档都是从URI指示的位置加载的,或者是从标准输入中读取的,并格式化为纯文本字符流,然后将其写入标准输出或输出文件中。输入URI可以指定一个远程站点,从该站点可以通过超文本传输​​协议(HTTP)加载文档。该程序能够保留表字段的原始位置,允许您设置屏幕宽度(给定数量的输出字符),并且还接受语法上不正确的输入(试图“合理地”解释它)。默认情况下,粗体和带下划线的文本使用退格序列呈现(在将程序的输出传递到“ less”或其他分页器中时特别有用)。通过RC文件,可以在很大程度上对所有渲染属性进行定制。
html2text

分类目录

具有商业许可证的Windows版html2text的替代方案