Question 1

どの形式を使うべきですか？

Accepted Answer

NFC が保存・転送・Web で最も安全なデフォルトです — 最短の正規形で、ほとんどのシステムが期待する形式です。システムが分解テキストを要求する場合（例：一部の macOS）は NFD を使います。NFKC・NFKD は合字・全角・上下付き文字の畳み込みなど互換変換を意図的に行いたい場合のみ使ってください — 損失のある変換だからです。

Question 2

「発音区別符号を除去」は何をしますか？

Accepted Answer

テキストを分解（NFD）し、すべての結合文字を除去してから選択した形式に再正規化します — 'café' は 'cafe'、'Crème Brûlée' は 'Creme Brulee' になります。ASCII スラッグやアクセント無視の検索キー作成に便利ですが、多くの言語で意味が変わるため、正確に保つ必要のあるテキストには使わないでください。

Question 3

なぜ形式間でバイト数が異なるのですか？

Accepted Answer

分解形式（NFD・NFKD）は通常より多くのコードポイントを使います — 合成 'é' は UTF-8 で 2 バイトの 1 文字ですが、'e' + 結合アクセントは合計 3 バイトの 2 文字です。互換形式はどちらにもなり得ます。表で正確なコードポイント・バイト長を比較できます。

Question 4

正規化は可逆ですか？

Accepted Answer

NFC ↔ NFD は正規等価性について情報を保存し可逆です。NFKC・NFKD は可逆ではありません — 合字や全角数字が畳み込まれると元の区別は失われます。発音区別符号の除去も一方向です。

形式	文字	バイト	= 入力?
NFC	17	32	はい
NFD	18	33	いいえ
NFKC	20	21	いいえ
NFKD	21	22	いいえ

Unicode 正規化 (NFC, NFD, NFKC, NFKD)

使い方

よくある質問

関連ツール

Markdown テーブル → CSV 変換

Markdown テーブル生成

テキスト Diff ビューア

Lorem Ipsum ジェネレーター

大文字・小文字変換

文字数・単語数カウンター