首頁 > 遊戲

假設檢驗基礎：α錯誤，β錯誤，樣本容量，效應量的關係簡介

由 Codewar 發表于遊戲2021-10-03

簡介如下圖：臨界值右邊，藍色的分佈對應的區域表示：在成立時（不成立），拒絕了，說明做出了正確的決斷，此時的機率用表示，也稱為統計檢驗力

樣本容量也稱為什麼

閱讀提示

本文針對剛剛接觸零假設顯著性檢驗的同學，最好已經瞭解：

假設檢驗

抽樣分佈

正態分佈

標準分數

做研究的基本套路

隨機變數

服從均值為

，標準差為

的正態分佈，即

。

現在對

施加某種處理，使

的值發生了變化，變成

。我們假設這種處理的效果是恆定的，即

。那麼，

只是均值發生了變化，而方差不變，分佈的形態也不變。

，其中

做心理學實驗，基本上就是這個套路：對

施加處理得到

。然後比較一下

與

的均值有沒有變化，以此來判斷處理是否有效果，效果如何。

當然直接比較

和

是不可能的，因為這兩個都是總體引數，基本上是不可能直接獲取的。我們能夠得到的只是

和

的一個樣本，需要透過樣本來推斷總體引數。

為了便於講解，我們假設未知的只是

現在我們就需要從

中抽取一個樣本量為

的樣本，該樣本均值用

表示。因為樣本容量為

的樣本可以抽取非常多，理論上是無限個，於是可以得到非常多的

。

也就是說，

也是一個隨機變數，此時

的分佈叫做樣本均值的

抽樣分佈

，其分佈的均值與的相

同，均為

，標準差為

，形態依然是正態分佈。此時抽樣分佈的標準差也稱為

標準誤

，因為其體現了抽樣誤差的大小。

零假設和備擇假設

進行假設檢驗的第一步，就是提出假設。

我們的研究總是期待處理是有效果的：

才是我們所希望的結果。

不過，進行假設檢驗所採用的邏輯是

反證法

，通常是從反面出發進行推導。所以，我們通常先假設

，這就是假設檢驗中的

零假設

。

與零假設互不相容的，就是研究者所希望的結果，即

，稱為

備擇假設

。

不同假設下抽樣分佈的形態，以及兩種錯誤

當

成立時，

，

的抽樣分佈為

。

當

成立時，

，

的抽樣分佈為

。

可見，兩個假設下，

的抽樣分佈僅僅是均值發生了變化，從影象上來看，二者相當於是平移了

的距離。

當然，

的取值是未知的，這個值實際上體現了

效應量

的大小，也是需要估計的。

影象如下：

由於進行假設檢驗都是從

出發，設定的顯著性水平

是在紅色的分佈中體現。

此時橘色縱線就是臨界值，它的位置由

決定，並將影象分成了兩部分：右邊是

拒絕域

。如果得到的樣本均值位於該區域，那麼做出的決斷就是拒絕

。左邊是接受域，如果得到的樣本均值位於臨界值的左邊，則接受

（準去來說應該是“不能拒絕

”）。

不論在臨界值的左邊還是右邊，都包含了紅色和藍色的兩個分佈。

臨界值右邊，紅色的分佈對應區域表示：在

成立時拒絕了

，說明做出了

錯誤

的決斷，此時犯錯的機率就是顯著性水平

。此時的錯誤也叫做Ⅰ型錯誤或者

錯誤

臨界值左邊，藍色的分佈對應區域表示：在

成立時（

不成立），接受了

。說明做出了

錯誤

的決斷，此時犯錯的機率為

，也稱為Ⅱ型錯誤或者

錯誤。如下圖：

臨界值左邊，紅色的分佈對應的區域表示：在

成立時，接受了

。此時做出了正確的決斷。機率為

。如下圖：

臨界值右邊，藍色的分佈對應的區域表示：在

成立時（

不成立），拒絕了

，說明做出了正確的決斷，此時的機率用

表示，也稱為統計檢驗力。表示了在

成立時，正確得到顯著結果的機率。如下圖：

在研究中，我們都是希望樣本均值

掉落在臨界值右邊

，為了避免在這種情況下犯錯，所以通常對

進行限制。

從圖中可以看到，

和

並不是屬於同一個分佈的，所以二者之和並不是1。

此外，在其他條件不變的情況下，如果

變小，臨界值往右移動，那麼

隨之變大。反之，

變大，

就變小

可以在研究前設定，那麼

怎麼計算呢？

研究中通常設定了

的大小，那麼

就不管了嗎？

當然不是，

也是一個非常重要的指標，因為它決定了統計檢驗力

的大小。

讓我們先來，看看，如果要計算

，還需要什麼？

如下圖：

既然已經知道了

，那麼便可以得到臨界值

到

的距離

，

。

從而求出

在藍色的分佈中，

體現了臨界值到

的距離，將其轉換為標準分數：

知道了

之後，便可以輕鬆的求出

了

可知，

受到3個因素的影響：

決定了臨界值的位置，所以肯定會影響

兩個分佈的標準距離

，影響了兩個分佈的偏離程度，從而影響了

。這個標準距離就是我們熟知的

效應量

。

樣本的大小

，影響了抽樣分佈的標準差

，從而影響了分佈的形狀（高狹，低矮），進一步影響了

。

實際上，

，以及效應量這四個指標，知道了任意三個，就可以推匯出最後一個。通常，

是已知的（由研究者確定，一般為0。05）。

在研究開始之前，通常需要確定樣本量

。此時可以透過查閱文獻，合理的假設效應量大小。並且進一步規定本次研究的檢驗力，確定

。據此推算出本次研究需要的

。

在研究結束之後，通常需要估計的檢驗力的大小

。此時

已知，可以利用樣本均值來估計

，樣本標準差來估計

（如果

已知就不用估計了），從而估計效應量的大小。進一步可以計算出檢驗力

。

當然，上面的講解使用的是最簡單的

檢驗，通常實際研究中很少用到。但計算的原理與

檢驗等是一致的，只是分佈圖不同而已。

分佈圖比正態分佈要複雜，通常也不會手算效應量，可以利用G*Power很方便的計算。

小結

和

位於不同的分佈中（前提不同），二者並不是互補的關係。

和效應量可以互相推導，知道了任意三個可以推導另一個。

可以利用G*Power方便的計算上述指標。

感謝大家耐心看完，也歡迎大家的意見和建議。

如果你是一個大學本科生或研究生，如果你正在因為你的統計作業、資料分析、論文、報告、考試等發愁，如果你在使用SPSS，R，Python，Mplus， Excel中遇到任何問題，都可以聯絡我。因為我可以給您提供最好的，最詳細和耐心的資料分析服務。

如果你對Z檢驗，t檢驗，方差分析，多元方差分析，迴歸，卡方檢驗，相關，多水平模型，結構方程模型，中介調節等等統計技巧有任何問題，請私信我，獲取最詳細和耐心的指導。

If you are a student and you are worried about you statistical #Assignments， #Data #Analysis， #Thesis， #reports， #composing， #Quizzes， Exams。。 And if you are facing problem in #SPSS， #R-Programming， #Excel， Mplus， then contact me。 Because I could provide you the best services for your Data Analysis。

Are you confused with statistical Techniques like z-test， t-test， ANOVA， MANOVA， Regression， Logistic Regression， Chi-Square， Correlation， Association， SEM， multilevel model， mediation and moderation etc。 for your Data Analysis。。。？？

Then Contact Me。 I will solve your Problem。。。

加油吧，打工人！

本文轉載自AhaDad，請支援原創！

Tags：臨界值分佈假設檢驗抽樣

上一篇：有一種春天，叫百花山

下一篇：原神阿貝多卡池30抽歪到了砂糖，玩家卻說出了4個字：撿到寶了

首頁 > 遊戲

假設檢驗基礎：α錯誤，β錯誤，樣本容量，效應量的關係簡介

相關文章

推薦文章