总体均值的估计

最基本的一点区间估计过程涉及到估计总体均值。假设它是感兴趣的估计总体均值μ,定量变量。数据从一个简单的随机样本收集可用于计算样本均值,x̄的价值x̄提供了一个μ的点估计。

当样本均值作为点估计的人口意味着,一些错误可以预计由于样本,或人口的子集,用来计算点估计。样本均值之差的绝对值,x̄,总体均值μ,书面|x̄−μ|,叫做抽样误差。区间估计集成了一个概率声明对抽样误差的大小。的抽样分布x̄这样的声明提供了依据。

统计表明,抽样分布的均值x̄等于总体均值μ,,标准偏差是由σ/√√n人口,其中σ是标准偏差。抽样分布的标准差称为标准错误。对于大的样本量,中心极限定理表明的抽样分布x̄可以用一个近似正常吗概率分布。作为一个实践的问题,统计学家通常认为的样本大小30或更大。

在大样本的情况下,总体均值的95%置信区间估计是由x̄±1.96σ/√√n。当总体标准差σ,是未知的,使用样本标准差σ估计的置信区间的公式。1.96σ/数量√√n通常被称为误差的估计。σ/数量√√n是标准错误,1.96是标准错误的数量意味着必须包括95%的吗值在一个正态分布。95%置信区间的解释是,95%的区间构造以这种方式将包含总体均值。因此,任何时间间隔计算以这种方式包含总体均值有95%的信心。通过改变常数从1.96到1.645,90%置信区间。应该注意公式的一个区间估计,90%置信区间比95%置信区间窄,因此有一个略小的信心包括总体均值。低水平的信心导致更窄的区间。在实践中,使用最广泛的95%置信区间。

由于的存在n^1/2术语在一个区间估计的公式,样本量影响误差。大样本大小导致更小的误差。这种观察形成的基础程序用于选择样本的大小。样本大小可以选择,置信区间满足任意需求大小的误差。

刚刚描述的程序开发总体均值的区间估计是基于大样本的使用。在小样本case-i.e。,样本容量n小于30t分配时使用指定误差和构造置信区间估计。例如,在95%的置信水平,一个值的t分布,由价值决定的n,将取代1.96值获得的正态分布。的t值总是会更大,导致广泛的置信区间,但是,随着样本容量变大,t值接近相应的值从一个正态分布。样本容量的25日t使用的值是2.064,比正常的概率分布值1.96在大样本的情况下。

其他参数估计

为定性变量,人口比例是一个参数感兴趣的。点估计的人口比例样本比例。了解样本的抽样分布的比例,一个区间估计的人口比例以同样的方式获得总体均值。点和区间估计这样的程序也适用于其他人群参数。例如,人口的区间估计方差所需,标准差,总可以在其他应用程序中。

两个种群的评估程序

估计程序可以扩展到两个种群进行比较研究。例如,假设正在进行一项研究以确定的薪资差异男性和女性人口的人口。两个独立的简单随机样本,一个来自人口的男人和一个来自妇女的人口,将提供两个样本均值,x̄₁和x̄₂。两个样本之间的差异意味着,x̄₁−x̄₂将用作点估计的两个总体均值之间的差异。的抽样分布x̄₁−x̄₂将提供一个置信区间估计的基础的两个总体均值之间的差异。为定性变量,点和区间估计的人口比例的差别可以通过考虑构造样本比例的区别。