第三章 參數估計
重點:
1.總體參數與統計量
2.樣本均值與樣本比例及其標準誤差
難點:
1.區間估計
2.樣本量的確定
知識點一:總體分布與總體參數
統計分析數據的方法包括:描述統計和推斷統計(第一章)
推斷統計是研究如何利用樣本數據來推 斷總體特征的統計學方法,包括參數估計和假設檢驗兩大類。
總體分布是總體中所有觀測值所形成的分布。
總體參數是對總體特征的某個概括性的度量。通常有
總體平均數( μ)
總體方差(σ2 )
總體比例( π)
知識點二:統計量和抽樣分布
總體參數是未知的,但可以利用樣本信息來推斷。
統計量是根據樣本數據計算的用于推斷總體的某些量,是對樣本特征的某個概括性度量。
統計量是樣本的函數,如樣本均值()、樣本方差( s2)、樣本比例(p)等。
構成統計量的函數中不能包括未知因素。
由于樣本是從總體中隨機抽取的,樣本具有隨機性,由樣本數據計算出的統計量也就是隨機的。統計量的取值是依據樣本而變化的,不同的樣本可以計算出不同的統計量值。
例題·判斷題:統計量是樣本的函數。
答案:正確
解析:統計量是樣本的函數,如樣本均值()、樣本方差()、樣本比例(p)等。構成統計量的函數中不能包括未知因素。
[例題·判斷題]在抽樣推斷中,作為推斷對象的總體和作為觀察對象的樣本都是確定的、唯一的。
答案:錯誤
解析:作為推斷對象的總體是唯一的,但作為觀察對象的樣本不是唯一的,不同的樣本可以計算出不同的統計量值。。
(一)樣本均值的抽樣分布
設總體共有n個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有nn 種抽法,即可以組成nn不同的樣本,在不重復抽樣時,共有 個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。
但現實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實際上是一種理論分布。
數理統計學的相關定理已經證明:
即樣本均值的均值就是總體均值。
在重置抽樣時,樣本均值的方差為總體方的1/n,即
在不重置抽樣時,樣本均值的方差為
其中,為修正系數,對于無限總體進行不重置抽樣時,可以按照重置抽樣計算,當總體為有限總體,n比較大而n/n≥5% 時,修正系數可以簡化為1-n/n,當n比較大,而n/n<5%時,修正系數可以近似為1,即可以按重置抽樣計算。
當總體服從正態分布時,樣本均值一定服從正態分布,即有x~n(,)時,~n(,)
若總體為未知的非正態分布時,只要樣本容量 n足夠大(通常要求n ≥30),樣本均值仍會接近正態分布。樣本分布的期望值為總體均值,樣本方差為總體方差的1/n 。這就是統計上著名的中心極限定理。
該定理可以表述為:從均值為,方差為的總體中,抽取樣本量為n的隨機樣本,當n充分大時(通常要求n ≥30),樣本均值的分布近似服從均值為,方差為的正態分布。
如果總體不是正態分布,當n為小樣本時(通常n<30),樣本均值的分布則不服從正態分布。
[例題·單選題]設一個總體共有5個元素,從中隨機抽取一個容量為2的樣本,在重置抽樣時,共有( )個樣本
a.25 b.10 c.5 d.1
答案:a
解析:在重置抽樣時,共有nn 種抽法,共有樣本nn個,即52=5×5=25個。
[例題·單選題]設一個總體共有5個元素,從中隨機抽取一個容量為2的樣本,在不重置抽樣時,共有( )個樣本
a.25 b.10
c.5 d.1
答案:b
解析:在不重復抽樣時,共有個可能的樣本。即(個)
(二)樣本比例的抽樣分布
比例是指具有某種屬性的單位占全部單位數的比重。
總體比例(通常用 π表示)是總體中具有某種屬性的單位數占全部總體單位數的比例,是一個參數,通常是未知的,也是我們想通過抽樣得到的說明總體特征的數據。
樣本比例(通常用p表示)是隨機抽取的樣本中具有某種屬性的單位數占樣本全部單位數的比例,是一個樣本統計量,是隨機變量,對于一個已經抽取出來的樣本來講,是可以觀察到的。描述所有可能樣本比例的概率分布就是樣本比例的抽樣分布。
當樣本容量比較大時,樣本比例p近似服從正態分布,且有p的數學期望就是總體比率π ,即σ(p)=π
而p的方差與抽樣方法有關,在重置抽樣下為,在不重置抽樣下為
即在重置抽樣時, p的分布為p~n(,)
在不重置抽樣時, p的分布為p~n(,)
一般講,當 np≥5,并n(1-p) ≥5時,就可以認為樣本容量足夠大。對于無限總體進行不重置抽樣時,可以按照重置抽樣計算,當總體為有限總體,當n比較大,而n/n ≤ 5%時,修正系數 會趨向1,這時也可以按重置抽樣計算方差。
從上述分析可以看出,隨著樣本容量的增大,樣本比例的方差愈來愈小,說明樣本比例隨樣本容量增大,圍繞總體比例分布的峰度愈來愈高。
[例題·單選題]當樣本容量比較大時,在重置抽樣條件下,樣本比例p的方差為( )
a. b. c. d.
答案:a
解析:當樣本容量比較大時,在重置抽樣條件下,樣本比例p的方差為
[例題·單選題]設一個總體含有3個可能元素,取值分別為1,2,3。從該總體中采取重復抽樣方法抽取樣本量為2的所有可能樣本,樣本均值為2的概率值是( )
a.1/9 b.2/9 c.1/3 d. 4/9
答案:c
解析:在重復抽樣下,樣本為1,2,3的概率都是1/3。
[例題·判斷題] 樣本容量是指從一個總體中可能抽取的樣本個數。
答案:錯誤
解析:樣本容量是樣本中個體的數目。一個總體可以有多個樣本,各個樣本的的容量可以相同可以不同。
[例題·判斷題]在確定總體比例估計中的樣本容量時,如果缺少比例的方差,常取比例值為 0.5。
答案:正確
知識點三:統計量的標準誤差
統計量的標準誤差也稱為標準誤,是指樣本統計量分布的標準差。可用于衡量樣本統計量的離散程度。在參數估計中,它是用于衡量樣本統計量與總體參數之間差距的一個重要尺度。
樣本均值的標準誤計算公式為:
當總體標準差 σ未知時,可用樣本標準差s代替計算,這時計算的標準誤差稱為估計標準誤差。
相應地,樣本比例的標準誤計算公式為
同樣,當總體比例的方差π(1-π )未知時,可用樣本比例的方差p(1-p)代替。
[例題·單選題] 樣本均值的標準誤差計算公式為( )
a. b. c. d.
答案:b
解析:樣本均值的標準誤差計算公式為
[例題·單選題]樣本比例的標準誤差計算公式為( )
a. b. c. d.
答案:a
解析:樣本比例的標準誤差計算公式為
[例題·單選題]統計量的標準誤差也稱為標準誤,其大小與()。
a. 樣本量的平方根成反比 b. 樣本量的大小成反比
c. 樣本量的大小成正比 d. 總體的標準差成反比
答案:a
解析:樣本均值的標準誤計算公式為:,標準誤與標準差成正比,與樣本量的平方根成反比。