AZ Tools

描述统计计算器

日常

现实中的数据问题大多归结为两件事:中心在哪、离散有多大。本计算器一次给出两者的答案。粘贴以逗号、空格或换行分隔的数字,工具会返回计数、合计、三种集中趋势指标(均值、中位数、众数)、五数概括(最小、Q1、中位数、Q3、最大)、四分位距 IQR、样本及总体方差与标准差、可定义时的几何平均与调和平均、变异系数(CV)以及样本偏度。它相当于在电子表格里依次调用 STDEV、QUARTILE 等函数,但你不必挑选函数名,也无需记忆分母是 N 还是 N − 1。四分位使用线性插值(与 numpy 默认、Excel QUARTILE.INC 等价的“包含式”方法)。所有计算都在浏览器中本地完成,不上传任何数值。

集中趋势

计数 (n)

10

合计

159

均值

15.9

中位数

15.5

众数

4, 8, 16, 23 (×2)

离散

最小值

4

最大值

42

极差

38

方差(样本)

132.3222

方差(总体)

119.09

标准差(样本)

11.5031

标准差(总体)

10.9128

变异系数

72.35%

四分位 & IQR

Q1(25 分位)

8

中位数 (Q2)

15.5

Q3(75 分位)

21.25

IQR(Q3 − Q1)

13.25

其他指标

几何平均

12.4203

调和平均

9.5018

偏度(样本)

1.29

绿色高亮的是基于样本的公式——推断统计的默认选择。CV(变异系数)无量纲,适合比较不同量纲数据集间的离散。

使用方法

  1. 粘贴数据——逗号、空格、分号、换行都可作为分隔符;非数字标记会被忽略。
  2. 查看集中趋势块(均值、中位数、众数)以判断分布中心位置。
  3. 用离散块(标准差、方差、极差、变异系数)评估数据围绕均值的紧密程度。
  4. 参考四分位块的五数概括——位于 Q1 − 1.5 × IQR 或 Q3 + 1.5 × IQR 之外的值,是经典 Tukey 规则下的异常值候选。

常见问题

什么时候用样本标准差,什么时候用总体标准差?
如果手头的数字是抽自更大总体的样本,并希望估计总体的离散,请用样本标准差(除以 N − 1)——这是电子表格、统计课程和大多数科研软件的默认。只有当你的数字本身就是全体总体(例如只描述某班全体学生成绩,不做推断)时,才使用总体标准差(除以 N)。
为什么有时显示“无众数”?
如果每个值都只出现一次,就不存在“出现最多的值”,所以本计算器显示“无众数”。部分教材在该情形下把全部值视为众数,但在实务中“无众数”的表示更直观。
采用的是哪种四分位算法?
在排序后值之间做线性插值的 (N − 1) × q 位置法,也称“包含式”方法或 Tukey 铰链等价方案,与 numpy.quantile 默认及 Excel QUARTILE.INC 一致。Excel QUARTILE.EXC、R 的 Type 6 等在小样本下可能略有差异。
变异系数(CV)有什么用?
把标准差表示为均值的百分比,方便比较不同单位或不同量纲数据集间的离散程度。月销售额 CV 10% 与零件重量 CV 10% 表示相同的相对离散,尽管两者绝对标准差量纲不同。
为什么几何平均和调和平均有时为空?
二者仅在所有值均为正时定义——几何平均涉及乘积,调和平均涉及倒数之和。若数据中含 0 或负数,相应单元格会留空,而不显示误导性的数字。

相关工具