词频统计
文本
粘贴文本即可进行分词(Unicode 友好,能处理非拉丁文字)、按词计数,并按频率排序展示 Top N,每行一条柱状图。打开停用词过滤可排除 100+ 个最常见的英文虚词(the、a、of、to…)。适合 SEO 关键词密度、内容分析、文章编辑或发现自己写作里的过度用词。
—
总词数(过滤后): 0唯一词数: 0
粘贴文本后此处显示统计。
使用方法
- 在上方粘贴文本。
- 可选开启 "忽略大小写"、"过滤停用词"、"最小长度"。
- 查看 Top N 及柱状条。点 "显示全部" 看完整列表,或复制为 CSV。
常见问题
- 停用词列表是什么?
- 100+ 个高频英语虚词(冠词、介词、代词、助动词)。当 "the" 出现 200 次不再有信息量时尤其有用。需要原始计数请关闭。
- Unicode 分词怎么工作?
- 把任意脚本的字母/数字连续段视为一个词——`한글`、`日本語`、`español` 都能正确分词。但停用词列表仅适用英语。
- 为什么 `it's` 算 1 个词?
- 缩略词(`it's`、`don't`、`we're`)按人的书写方式作为单个 token。统计文本分析会拆开;可读性分析则不会。
- 对 SEO 关键词密度有用吗?
- 原始计数有用。但 2026 年关键词密度是较弱的 SEO 信号——现代搜索引擎更看语义相关,而非词频。用于编辑,而非操纵排名。