Question 1

乱码的成因是什么？

Accepted Answer

当以 UTF-8 保存的文本之后被用另一种单字节编码 — 多为 Windows-1252 或 ISO-8859-1 — 读取时就会发生。每个非 ASCII 字符以两个或更多 UTF-8 字节保存，逐字节读取这些字节会产生错误字符：é（两字节）显示为两个字符 Ã©。CSV 导入、数据库迁移，以及在编码不一致的系统间复制粘贴都是常见原因。

Question 2

会破坏已经正确的文本吗？

Accepted Answer

不会。只有当逆转后的字节构成有效 UTF-8 时修复才会成功，真正的乱码满足这一点而正确编码的文本不满足。因此已经正确的 'café'、'Köln'、'한국어' 或 '日本語' 会被判定为有效并原样保留 — 工具会报告无需修复。

Question 3

为何有时会进行不止一趟？

Accepted Answer

若文本被两次错误解码 — 例如 UTF-8 被按 Windows-1252 读取、保存后再次按 Windows-1252 读取 — 损坏会层层叠加。工具会反复修复，直到文本不再变化或不再能逆转为有效 UTF-8，并告知用了几趟。

Question 4

它没修好我的文本 — 为什么？

Accepted Answer

要么文本已经正确，要么损坏不属于常见的 UTF-8-当作-Windows-1252 这一类（例如被按 Shift_JIS 或 EUC-KR 误解码，或字节确实丢失）。本工具针对最常见的情形；若要以特定旧编码打开文件，请改用文本编码转换器。

乱码修复 (修复损坏的 UTF-8)

使用方法

常见问题

相关工具

Markdown 表格转 CSV 工具

Markdown 表格生成器

文本 Diff 查看器

Lorem Ipsum 生成器

大小写转换

字符与单词计数器