描述统计计算器
日常
现实中的数据问题大多归结为两件事:中心在哪、离散有多大。本计算器一次给出两者的答案。粘贴以逗号、空格或换行分隔的数字,工具会返回计数、合计、三种集中趋势指标(均值、中位数、众数)、五数概括(最小、Q1、中位数、Q3、最大)、四分位距 IQR、样本及总体方差与标准差、可定义时的几何平均与调和平均、变异系数(CV)以及样本偏度。它相当于在电子表格里依次调用 STDEV、QUARTILE 等函数,但你不必挑选函数名,也无需记忆分母是 N 还是 N − 1。四分位使用线性插值(与 numpy 默认、Excel QUARTILE.INC 等价的“包含式”方法)。所有计算都在浏览器中本地完成,不上传任何数值。
—
集中趋势
计数 (n)
10
合计
159
均值
15.9
中位数
15.5
众数
4, 8, 16, 23 (×2)
离散
最小值
4
最大值
42
极差
38
方差(样本)
132.3222
方差(总体)
119.09
标准差(样本)
11.5031
标准差(总体)
10.9128
变异系数
72.35%
四分位 & IQR
Q1(25 分位)
8
中位数 (Q2)
15.5
Q3(75 分位)
21.25
IQR(Q3 − Q1)
13.25
其他指标
几何平均
12.4203
调和平均
9.5018
偏度(样本)
1.29
绿色高亮的是基于样本的公式——推断统计的默认选择。CV(变异系数)无量纲,适合比较不同量纲数据集间的离散。
使用方法
- 粘贴数据——逗号、空格、分号、换行都可作为分隔符;非数字标记会被忽略。
- 查看集中趋势块(均值、中位数、众数)以判断分布中心位置。
- 用离散块(标准差、方差、极差、变异系数)评估数据围绕均值的紧密程度。
- 参考四分位块的五数概括——位于 Q1 − 1.5 × IQR 或 Q3 + 1.5 × IQR 之外的值,是经典 Tukey 规则下的异常值候选。
常见问题
- 什么时候用样本标准差,什么时候用总体标准差?
- 如果手头的数字是抽自更大总体的样本,并希望估计总体的离散,请用样本标准差(除以 N − 1)——这是电子表格、统计课程和大多数科研软件的默认。只有当你的数字本身就是全体总体(例如只描述某班全体学生成绩,不做推断)时,才使用总体标准差(除以 N)。
- 为什么有时显示“无众数”?
- 如果每个值都只出现一次,就不存在“出现最多的值”,所以本计算器显示“无众数”。部分教材在该情形下把全部值视为众数,但在实务中“无众数”的表示更直观。
- 采用的是哪种四分位算法?
- 在排序后值之间做线性插值的 (N − 1) × q 位置法,也称“包含式”方法或 Tukey 铰链等价方案,与 numpy.quantile 默认及 Excel QUARTILE.INC 一致。Excel QUARTILE.EXC、R 的 Type 6 等在小样本下可能略有差异。
- 变异系数(CV)有什么用?
- 把标准差表示为均值的百分比,方便比较不同单位或不同量纲数据集间的离散程度。月销售额 CV 10% 与零件重量 CV 10% 表示相同的相对离散,尽管两者绝对标准差量纲不同。
- 为什么几何平均和调和平均有时为空?
- 二者仅在所有值均为正时定义——几何平均涉及乘积,调和平均涉及倒数之和。若数据中含 0 或负数,相应单元格会留空,而不显示误导性的数字。