Question 1

chardetのような『判定』ライブラリがないのは?

Accepted Answer

ブラウザはchardetを持たず、いくつかの一般的なケースのために大きな文字コード判定ライブラリ（ICUの `CharsetDetector` のJSポートは~200KB）をインポートするのは過剰。このツールは95%のケースをカバー: BOM·ASCIIのみ·有効UTF-8·nullバイトパターンによるUTF-16。BOMなしのエキゾチックなアジア文字コード（Shift_JIS·GB2312·EUC-KR）にはchardetが必要 — ただしこのツールは『UTF-8ではない』と伝えるので他を探すべきと分かる。

Question 2

BOMって何?

Accepted Answer

Byte Order Markは文字コードを明示的にマークする2-4バイトのプレフィックス。UTF-8 BOMは `EF BB BF`（技術的に不要、議論あり — Microsoftは追加、Unixツールは通常削除）。UTF-16/32 BOM（`FF FE` など）はエンディアンも信号するので便利。ファイルにBOMがあれば絶対に信頼。

ファイル文字コード判定ツール

使い方

よくある質問

関連ツール

画像 → PDF 変換

ZIP 内容ビューア

ファイル分割

テキストエンコーディング変換

ファイルハッシュ (チェックサム)

CSV ↔ JSON 変換ツール