Soundex 语音编码生成器
文本
Soundex 是一种按英语读音为姓名建立索引的语音算法,使 Robert 和 Rupert 这样的拼写变体共享同一编码(R163)。每个编码保留首字母,再附加由辅音得出的三位数字,遵循美国国家档案馆(NARA)规则: 辅音被归入六个编号类别,重复且相邻的同类字母合并为一个,字母 H 和 W 透明处理(两侧字母仍会合并),元音会中断序列使相同编码被编码两次。每行输入一个名字即可一次得到全部编码。所有处理都在你的浏览器本地完成。
—
Soundex 编码
| 输入 | Soundex |
|---|---|
| Robert | R163 |
| Rupert | R163 |
| Ashcraft | A261 |
| Tymczak | T522 |
| Honeyman | H555 |
使用方法
- 每行输入或粘贴一个名字或单词。
- 查看每个名字旁边的 4 字符 Soundex 编码。
- 比较编码 — 编码相同表示在 Soundex 下读音等价的名字。
- 一键复制整个名字与编码表。
常见问题
- Soundex 编码如何构建?
- 保留首字母,然后将后续辅音编码为数字(b,f,p,v=1; c,g,j,k,q,s,x,z=2; d,t=3; l=4; m,n=5; r=6)。相邻的同数字字母合并为一个,H 和 W 跳过且不分隔,元音分隔。用零补齐到一个字母加三位数字。
- 为什么 Robert 和 Rupert 都得出 R163?
- Soundex 按读音而非拼写归并。两者都归约为 R + b/p(1)、r(6)、t(3),所以会刻意碰撞 — 这正是它发现拼写变体的方式。
- 这是哪种 Soundex 变体?
- 由美国国家档案馆定义的标准美式 Soundex,包含 H/W 透明规则(因此 Ashcraft 编码为 A261 而非 A226)。