Soundex 音声コード生成ツール
テキスト
Soundexは英語の発音に基づいて名前を索引する音声アルゴリズムで、RobertとRupertのような綴り違いが同じコード(R163)を持つようにします。各コードは最初の文字を残し、子音から導いた3桁の数字を付け、米国国立公文書館(NARA)の規則に従います: 子音を番号付きの6つの分類にまとめ、重複・隣接する同分類の文字を1つに統合し、HとWは透過的に扱い(両側の文字は依然として統合)、母音は流れを区切って同じコードが2回記録されるようにします。1行に1名ずつ入力すると、すべてのコードを一度に得られます。すべての処理はブラウザ内でローカルに実行されます。
—
Soundexコード
| 入力 | Soundex |
|---|---|
| Robert | R163 |
| Rupert | R163 |
| Ashcraft | A261 |
| Tymczak | T522 |
| Honeyman | H555 |
使い方
- 1行に1つの名前または単語を入力または貼り付けます。
- 各名前の隣にある4文字のSoundexコードを確認します。
- コードを比較します — コードが同じならSoundex上で音声的に等価な名前です。
- 名前とコードの表全体をワンクリックでコピーします。
よくある質問
- Soundexコードはどう作られますか?
- 最初の文字を残し、続く子音を数字にエンコードします(b,f,p,v=1; c,g,j,k,q,s,x,z=2; d,t=3; l=4; m,n=5; r=6)。隣接する同じ数字の文字は1つに統合し、HとWは区切らずにスキップし、母音は区切ります。最初の文字1つと数字3つになるよう0で埋めます。
- なぜRobertとRupertがどちらもR163になるのですか?
- Soundexは綴りではなく音でまとめるからです。どちらもR + b/p(1)、r(6)、t(3)に還元され、意図的に衝突します — こうして綴り違いを見つけます。
- どのSoundex変種ですか?
- 米国国立公文書館が定義した標準的なアメリカ式Soundexで、H/W透過規則を含みます(そのためAshcraftはA226ではなくA261にエンコードされます)。
関連ツール
Markdown テーブル → CSV 変換
GitHub 形式の Markdown テーブルを CSV、TSV、セミコロン区切りの行に変換します。ブラウザ上で動作します。
テキスト00
Markdown テーブル生成
CSV・TSV・パイプ区切りデータを整列された GitHub 風 Markdown テーブルに変換。
テキスト00
テキスト Diff ビューア
2 つのテキストを行 / 単語単位で比較し、追加・削除をハイライト。
テキスト00
Lorem Ipsum ジェネレーター
段落・文・単語の単位でダミーテキストを生成。
テキスト00
大文字・小文字変換
大文字・小文字・Title・camelCase・snake_case などに変換。
テキスト00
文字数・単語数カウンター
文字・単語・文・行・バイト数をリアルタイムで数えます。
テキスト00