Question 1

为什么没有像 chardet 那样的『检测』库?

Accepted Answer

浏览器不附带 chardet，为少数常见情况导入大型编码检测库（ICU `CharsetDetector` 的 JS 端口约 200KB）过分。本工具覆盖 95% 的情况：BOM、纯 ASCII、有效 UTF-8 以及通过空字节模式的 UTF-16。对无 BOM 的异国亚洲编码（Shift_JIS、GB2312、EUC-KR），你需要 chardet — 但本工具会告诉你『不是 UTF-8』，让你知道去别处找。

Question 2

BOM 是怎么回事?

Accepted Answer

Byte Order Mark 是显式标记编码的 2-4 字节前缀。UTF-8 BOM 是 `EF BB BF`（技术上不必要、有争议 — Microsoft 添加，Unix 工具通常去除）。UTF-16/32 BOM（`FF FE` 等）有用，因为它们也信号 endianness。如果文件有 BOM，绝对信任它。

文件编码检测器

使用方法

常见问题

相关工具

图片 → PDF 转换器

ZIP 内容查看器

文件分割器

文本编码转换器

文件哈希 (校验和)

CSV ↔ JSON 转换器