AZ Tools

HTML 转纯文本

文本

用一个专门的小解析器一次走完输入 — 无 DOM 往返 — 仅输出文本内容。`<script>`、`<style>`、`<iframe>` 等连同其内容一起丢弃;块级标签(`<p>`、`<h1>`、`<li>`、…)变成换行;`&amp;` 与 `&copy;` 等实体被解码回字符。当你从 CMS 或邮件复制了富文本,需要为 markdown 文件、电子表格或终端获取纯净内容时很有用。

纯文本 (62 字符)
Hello, world!

This is a link &amp; some text.

One

Two

End.

标签剥离不是清理器 — 切勿信任恶意 HTML,若要再渲染请通过 DOMPurify。

使用方法

  1. 把 HTML 片段粘到输入。
  2. 按需切换选项 — 保留块级换行、压缩 whitespace 连续、解码实体。
  3. 复制输出。显示字符数以便核对字段长度限制。

常见问题

为什么不直接用浏览器的 `innerText`?
`innerText` 能用但带入 CSS 布局(所以会依文档样式而变),并且必须先构建好 DOM 才能运行。本工具是个小型纯解析器 — 对相同输入总是产生相同输出,与样式无关。
`preserveBreaks` 开/关有什么区别?
开启时,块级标签(`<p>`、`<h1>`、`<li>`、`<br>`、…)在输出中变成换行。关闭时,整段输入压缩到一行 — 当你需要把文本放进 CSV 单元格或单行标题时有用。
输入会被清理吗?
所有标签都被剥离 — 输出中没有 HTML — 但解析器有意保持极简。对于打算再渲染的不可信 HTML,请用 DOMPurify 这样真正的清理器,而不要依赖 strip 步骤。

相关工具