首頁 > 遊戲
假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關係簡介
由 Codewar 發表于 遊戲2021-10-03
簡介如下圖:臨界值右邊,藍色的分佈對應的區域表示:在成立時(不成立),拒絕了,說明做出了正確的決斷,此時的機率用表示,也稱為統計檢驗力
樣本容量也稱為什麼
閱讀提示
本文針對剛剛接觸零假設顯著性檢驗的同學,最好已經瞭解:
假設檢驗
抽樣分佈
正態分佈
標準分數
做研究的基本套路
隨機變數
服從均值為
,標準差為
的正態分佈,即
。
現在對
施加某種處理,使
的值發生了變化,變成
。我們假設這種處理的效果是恆定的,即
。那麼,
只是均值發生了變化,而方差不變,分佈的形態也不變。
,其中
做心理學實驗,基本上就是這個套路:對
施加處理得到
。然後比較一下
與
的均值有沒有變化,以此來判斷處理是否有效果,效果如何。
當然直接比較
和
是不可能的,因為這兩個都是總體引數,基本上是不可能直接獲取的。我們能夠得到的只是
和
的一個樣本,需要透過樣本來推斷總體引數。
為了便於講解,我們假設未知的只是
現在我們就需要從
中抽取一個樣本量為
的樣本,該樣本均值用
表示。因為樣本容量為
的樣本可以抽取非常多,理論上是無限個,於是可以得到非常多的
。
也就是說,
也是一個隨機變數,此時
的分佈叫做樣本均值的
抽樣分佈
,其分佈的均值與的相
同,均為
,標準差為
,形態依然是正態分佈。此時抽樣分佈的標準差也稱為
標準誤
,因為其體現了抽樣誤差的大小。
零假設和備擇假設
進行假設檢驗的第一步,就是提出假設。
我們的研究總是期待處理是有效果的:
才是我們所希望的結果。
不過,進行假設檢驗所採用的邏輯是
反證法
,通常是從反面出發進行推導。所以,我們通常先假設
,這就是假設檢驗中的
零假設
。
與零假設互不相容的,就是研究者所希望的結果,即
,稱為
備擇假設
。
不同假設下抽樣分佈的形態,以及兩種錯誤
當
成立時,
,
的抽樣分佈為
。
當
成立時,
,
的抽樣分佈為
。
可見,兩個假設下,
的抽樣分佈僅僅是均值發生了變化,從影象上來看,二者相當於是平移了
的距離。
當然,
的取值是未知的,這個值實際上體現了
效應量
的大小,也是需要估計的。
影象如下:
由於進行假設檢驗都是從
出發,設定的顯著性水平
是在紅色的分佈中體現。
此時橘色縱線就是臨界值,它的位置由
決定,並將影象分成了兩部分:右邊是
拒絕域
。如果得到的樣本均值位於該區域,那麼做出的決斷就是拒絕
。左邊是接受域,如果得到的樣本均值位於臨界值的左邊,則接受
(準去來說應該是“不能拒絕
”)。
不論在臨界值的左邊還是右邊,都包含了紅色和藍色的兩個分佈。
臨界值右邊,紅色的分佈對應區域表示:在
成立時拒絕了
,說明做出了
錯誤
的決斷,此時犯錯的機率就是顯著性水平
。此時的錯誤也叫做Ⅰ型錯誤或者
錯誤
臨界值左邊,藍色的分佈對應區域表示:在
成立時(
不成立),接受了
。說明做出了
錯誤
的決斷,此時犯錯的機率為
,也稱為Ⅱ型錯誤或者
錯誤。如下圖:
臨界值左邊,紅色的分佈對應的區域表示:在
成立時,接受了
。此時做出了正確的決斷。機率為
。如下圖:
臨界值右邊,藍色的分佈對應的區域表示:在
成立時(
不成立),拒絕了
,說明做出了正確的決斷,此時的機率用
表示,也稱為統計檢驗力。表示了在
成立時,正確得到顯著結果的機率。如下圖:
在研究中,我們都是希望樣本均值
掉落在臨界值右邊
,為了避免在這種情況下犯錯,所以通常對
進行限制。
從圖中可以看到,
和
並不是屬於同一個分佈的,所以二者之和並不是1。
此外,在其他條件不變的情況下,如果
變小,臨界值往右移動,那麼
隨之變大。反之,
變大,
就變小
可以在研究前設定,那麼
怎麼計算呢?
研究中通常設定了
的大小,那麼
就不管了嗎?
當然不是,
也是一個非常重要的指標,因為它決定了統計檢驗力
的大小。
讓我們先來,看看,如果要計算
,還需要什麼?
如下圖:
既然已經知道了
,那麼便可以得到臨界值
到
的距離
,
。
從而求出
在藍色的分佈中,
體現了臨界值到
的距離,將其轉換為標準分數:
知道了
之後,便可以輕鬆的求出
了
可知,
受到3個因素的影響:
決定了臨界值的位置,所以肯定會影響
兩個分佈的標準距離
,影響了兩個分佈的偏離程度,從而影響了
。這個標準距離就是我們熟知的
效應量
。
樣本的大小
,影響了抽樣分佈的標準差
,從而影響了分佈的形狀(高狹,低矮),進一步影響了
。
實際上,
,以及效應量這四個指標,知道了任意三個,就可以推匯出最後一個。通常,
是已知的(由研究者確定,一般為0。05)。
在研究開始之前,通常需要確定樣本量
。此時可以透過查閱文獻,合理的假設效應量大小。並且進一步規定本次研究的檢驗力,確定
。據此推算出本次研究需要的
。
在研究結束之後,通常需要估計的檢驗力的大小
。此時
已知,可以利用樣本均值來估計
,樣本標準差來估計
(如果
已知就不用估計了),從而估計效應量的大小。進一步可以計算出檢驗力
。
當然,上面的講解使用的是最簡單的
檢驗,通常實際研究中很少用到。但計算的原理與
檢驗等是一致的,只是分佈圖不同而已。
分佈圖比正態分佈要複雜,通常也不會手算效應量,可以利用G*Power很方便的計算。
小結
和
位於不同的分佈中(前提不同),二者並不是互補的關係。
和效應量可以互相推導,知道了任意三個可以推導另一個。
可以利用G*Power方便的計算上述指標。
感謝大家耐心看完,也歡迎大家的意見和建議。
如果你是一個大學本科生或研究生,如果你正在因為你的統計作業、資料分析、論文、報告、考試等發愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問題,都可以聯絡我。因為我可以給您提供最好的,最詳細和耐心的資料分析服務。
如果你對Z檢驗,t檢驗,方差分析,多元方差分析,迴歸,卡方檢驗,相關,多水平模型,結構方程模型,中介調節等等統計技巧有任何問題,請私信我,獲取最詳細和耐心的指導。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams。。 And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me。 Because I could provide you the best services for your Data Analysis。
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc。 for your Data Analysis。。。??
Then Contact Me。 I will solve your Problem。。。
加油吧,打工人!
本文轉載自AhaDad,請支援原創!