Html2OpenXml:HTML转化为OpenXml的.Net库,轻...

玩点科技新鲜事 2024-09-29 16:52:33

我是编程乐趣,一个10年.Net开发经验老程序员,点击右上方“关注”,每天为你分享开源项目和编程知识。

推荐一个开源库,轻松实现HTML转化为OpenXml。

01

项目简介

Html2OpenXml 是一个开源.Net库,旨在将简单或复杂的HTML内容转换为OpenXml组件。

该项目始于2009年,最初是为了将用户评论转换为Word文档而设计的

随着时间的推移,Html2OpenXml 不断发展和完善,现在已经成为处理HTML到OpenXml转换的强大工具。

02

项目核心功能

HTML转OpenXml:该库能够将HTML文档(包括简单的文本、图像、表格等)转换为OpenXml格式的组件,进而可以被Microsoft Word等应用程序识别和处理。

.Net支持版本:Html2OpenXml 支持.Net Framework 4.6.2、.NET Standard 2.0 和 .NET 8,确保了在不同.Net环境下的兼容性。

依赖:该库依赖于DocumentFormat.OpenXml和AngleSharp这两个包,分别用于处理OpenXml文档和HTML解析。

03

支持Html标签

常规标签:如<a>, <h1>-<h6>, <b>, <i>, <u>, <s>, <del>, <ins>, <em>, <strike>, <strong>等。

图像和图表:<img>, <figcaption>, <svg>。

表格相关:<table>, <td>, <tr>, <th>, <tbody>, <thead>, <tfoot>, <caption>, <col>。

其他常用标签:如<div>, <span>, <p>, <ul>, <ol>, <li>, <q>, <blockquote>, <article>, <aside>, <section>等。

需要注意的是,标签的样式属性style是支持的,但JavaScript (<script>), CSS样式(<style>), <meta>标签、注释、按钮和输入控件等HTML元素在转换过程中会被忽略。

04

使用示例

该项目有着详细的开发文档,并且项目中也提供示例。

开发文档:

https://github.com/onizet/html2openxml/wiki

Html转为Word示例截图

Html代码

转换后的Word截图

从截图可以看出Html标签、样式等都可以正常转换过来。

05

项目地址

https://github.com/onizet/html2openxml

- End -

.Net开源项目合集:https://github.com/bianchenglequ/NetCodeTop

推荐阅读

0 阅读:0

玩点科技新鲜事

简介:感谢大家的关注