设一组数据x1,x2,x3……xn中,各组数据与它们的平均数的差的平方分别是(x1-)2,(x2-2……(xn-)2,那么我们用他们的平均数来衡量这组数据的波动大小,并把它叫做这组数据的方差。
例如两人的5次测验成绩如下:X: 50,100,100,60,50,平均值E(X)=72;Y:73, 70,75,72,70 平均值E(Y)=72。平均成绩相同,但X 不稳定,对平均值的偏离大。
方差描述随机变量对于数学期望的偏离程度。单个偏离是消除符号影响方差即偏离平方的均值,记为E(X):直接计算公式分离散型和连续型。推导另一种计算公式得到:“方差等于各个数据与其算术平均数的离差平方和的平均数”。其中,分别为离散型和连续型计算公式 。 称为标准差或均方差,方差描述波动程度。
设C为常数,则D(C) = 0(常数无波动);D(CX )=C2D(X ) (常数平方提取,C为常数,X为随机变量)。
证:特别地 D(-X ) = D(X ), D(-2X ) = 4D(X )(方差无负值)。
若X 、Y 相互独立,则,证:记前面两项恰为 D(X )和D(Y ),第三项展开后为
当X、Y 相互独立时,故第三项为零。特别地独立前提的逐项求和,可推广到有限项。
方差公式平均数:(n表示这组数据个数,x1、x2、x3……xn表示这组数据具体数值)。