1、数据的两个特征:集中趋势和离散中程度(波动大小),
集中趋势指的是数据的“一般水平”或“平均水平”。
离散程度指的是数据围绕“平均值”的变化情况。
2、平均数、中位数、众数反映了数据的集中趋势
一、平均数:所有数据之和再除以数据的个数所得值,又称算术平均数。
公式
平均数性质
性质证明
二、中位数:把一组数据按从小到大的顺序排列,正中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
特点:
①中位数把样本数据分为两部分,一部分大于中位数,另一部分小于中位数;
②中位数不受少数几个极端值的影响;
③由于当样本数据为偶数个时,中位数等于中间两个数据的平均值,因此有时中位数未必在样本数据中
三、众数:数据中出现次数最多的数据。
特点:
①可以不存在或不止一个;
②不受极端数据的影响,求法简单;
③可靠性差,如0,0,2,3,5这组数据中,众数是0,它很难真实反映这组数据的“平均水平”(集中趋势);
④众数在难以定义“平均数”或“中位数”时常用,故一般可用于统计非数字型数据。
⑤众数在销售统计中常用
3、极差、方差、标准差刻画的是数据的离散程度。
一、极差:数据中最大值与最小值的差。
特点:极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能精确反映测量值彼此相符合的程度,但计算简单。
二、方差:样本中各数据与样本平均数的差的平方的平均数叫做方差,方差常记作:S2
特点:
①方差越大,数据的离散程度越大(波动越大)
②公式
方差性质
三、标准差: 方差的算术平方根称为标准差
特点:
①与原始数据单位相同,是反映离散程度的理想度量
②公式