首頁 > 遊戲

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

由 Codewar 發表于 遊戲2021-10-03

簡介如下圖:臨界值右邊,藍色的分佈對應的區域表示:在成立時(不成立),拒絕了,說明做出了正確的決斷,此時的機率用表示,也稱為統計檢驗力

樣本容量也稱為什麼

閱讀提示

本文針對剛剛接觸零假設顯著性檢驗的同學,最好已經瞭解:

假設檢驗

抽樣分佈

正態分佈

標準分數

做研究的基本套路

隨機變數

服從均值為

,標準差為

的正態分佈,即

現在對

施加某種處理,使

的值發生了變化,變成

。我們假設這種處理的效果是恆定的,即

。那麼,

只是均值發生了變化,而方差不變,分佈的形態也不變。

,其中

做心理學實驗,基本上就是這個套路:對

施加處理得到

。然後比較一下

的均值有沒有變化,以此來判斷處理是否有效果,效果如何。

當然直接比較

是不可能的,因為這兩個都是總體引數,基本上是不可能直接獲取的。我們能夠得到的只是

的一個樣本,需要透過樣本來推斷總體引數。

為了便於講解,我們假設未知的只是

現在我們就需要從

中抽取一個樣本量為

的樣本,該樣本均值用

表示。因為樣本容量為

的樣本可以抽取非常多,理論上是無限個,於是可以得到非常多的

也就是說,

也是一個隨機變數,此時

的分佈叫做樣本均值的

抽樣分佈

,其分佈的均值與的相

同,均為

,標準差為

,形態依然是正態分佈。此時抽樣分佈的標準差也稱為

標準誤

,因為其體現了抽樣誤差的大小。

零假設和備擇假設

進行假設檢驗的第一步,就是提出假設。

我們的研究總是期待處理是有效果的:

才是我們所希望的結果。

不過,進行假設檢驗所採用的邏輯是

反證法

,通常是從反面出發進行推導。所以,我們通常先假設

,這就是假設檢驗中的

零假設

與零假設互不相容的,就是研究者所希望的結果,即

,稱為

備擇假設

不同假設下抽樣分佈的形態,以及兩種錯誤

成立時,

的抽樣分佈為

成立時,

的抽樣分佈為

可見,兩個假設下,

的抽樣分佈僅僅是均值發生了變化,從影象上來看,二者相當於是平移了

的距離。

當然,

的取值是未知的,這個值實際上體現了

效應量

的大小,也是需要估計的。

影象如下:

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

由於進行假設檢驗都是從

出發,設定的顯著性水平

是在紅色的分佈中體現。

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

此時橘色縱線就是臨界值,它的位置由

決定,並將影象分成了兩部分:右邊是

拒絕域

。如果得到的樣本均值位於該區域,那麼做出的決斷就是拒絕

。左邊是接受域,如果得到的樣本均值位於臨界值的左邊,則接受

(準去來說應該是“不能拒絕

”)。

不論在臨界值的左邊還是右邊,都包含了紅色和藍色的兩個分佈。

臨界值右邊,紅色的分佈對應區域表示:在

成立時拒絕了

,說明做出了

錯誤

的決斷,此時犯錯的機率就是顯著性水平

。此時的錯誤也叫做Ⅰ型錯誤或者

錯誤

臨界值左邊,藍色的分佈對應區域表示:在

成立時(

不成立),接受了

。說明做出了

錯誤

的決斷,此時犯錯的機率為

,也稱為Ⅱ型錯誤或者

錯誤。如下圖:

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

臨界值左邊,紅色的分佈對應的區域表示:在

成立時,接受了

。此時做出了正確的決斷。機率為

。如下圖:

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

臨界值右邊,藍色的分佈對應的區域表示:在

成立時(

不成立),拒絕了

,說明做出了正確的決斷,此時的機率用

表示,也稱為統計檢驗力。表示了在

成立時,正確得到顯著結果的機率。如下圖:

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

在研究中,我們都是希望樣本均值

掉落在臨界值右邊

,為了避免在這種情況下犯錯,所以通常對

進行限制。

從圖中可以看到,

並不是屬於同一個分佈的,所以二者之和並不是1。

此外,在其他條件不變的情況下,如果

變小,臨界值往右移動,那麼

隨之變大。反之,

變大,

就變小

可以在研究前設定,那麼

怎麼計算呢?

研究中通常設定了

的大小,那麼

就不管了嗎?

當然不是,

也是一個非常重要的指標,因為它決定了統計檢驗力

的大小。

讓我們先來,看看,如果要計算

,還需要什麼?

如下圖:

假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介

既然已經知道了

,那麼便可以得到臨界值

的距離

從而求出

在藍色的分佈中,

體現了臨界值到

的距離,將其轉換為標準分數:

知道了

之後,便可以輕鬆的求出

可知,

受到3個因素的影響:

決定了臨界值的位置,所以肯定會影響

兩個分佈的標準距離

,影響了兩個分佈的偏離程度,從而影響了

。這個標準距離就是我們熟知的

效應量

樣本的大小

,影響了抽樣分佈的標準差

,從而影響了分佈的形狀(高狹,低矮),進一步影響了

實際上,

,以及效應量這四個指標,知道了任意三個,就可以推匯出最後一個。通常,

是已知的(由研究者確定,一般為0。05)。

在研究開始之前,通常需要確定樣本量

。此時可以透過查閱文獻,合理的假設效應量大小。並且進一步規定本次研究的檢驗力,確定

。據此推算出本次研究需要的

在研究結束之後,通常需要估計的檢驗力的大小

。此時

已知,可以利用樣本均值來估計

,樣本標準差來估計

(如果

已知就不用估計了),從而估計效應量的大小。進一步可以計算出檢驗力

當然,上面的講解使用的是最簡單的

檢驗,通常實際研究中很少用到。但計算的原理與

檢驗等是一致的,只是分佈圖不同而已。

分佈圖比正態分佈要複雜,通常也不會手算效應量,可以利用G*Power很方便的計算。

小結

位於不同的分佈中(前提不同),二者並不是互補的關係。

和效應量可以互相推導,知道了任意三個可以推導另一個。

可以利用G*Power方便的計算上述指標。

感謝大家耐心看完,也歡迎大家的意見和建議。

如果你是一個大學本科生或研究生,如果你正在因為你的統計作業、資料分析、論文、報告、考試等發愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問題,都可以聯絡我。因為我可以給您提供最好的,最詳細和耐心的資料分析服務。

如果你對Z檢驗,t檢驗,方差分析,多元方差分析,迴歸,卡方檢驗,相關,多水平模型,結構方程模型,中介調節等等統計技巧有任何問題,請私信我,獲取最詳細和耐心的指導。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams。。 And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me。 Because I could provide you the best services for your Data Analysis。

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc。 for your Data Analysis。。。??

Then Contact Me。 I will solve your Problem。。。

加油吧,打工人!

本文轉載自AhaDad,請支援原創!

Tags:臨界值分佈假設檢驗抽樣