首頁 > 農業

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

由 Codewar 發表于 農業2021-10-24

簡介再看隨機斜率,就是說,有可能員工起薪都一樣只是薪資增長斜率在不同部門不一樣,要擬合這樣一個混合效應模型我們就要給模型的高水平,也就是部門水平加上隨機斜率:此時我們的模型可以擬合不同部門的斜率,這個叫做隨機斜率模型

混合模型與變截距模型有何區別

好多同學諮詢我混合效應模型,有些問題自己需要講很多遍,想想就再開一貼,爭取這一篇文章給大家寫清楚。

混合效應模型名字很多,

Hierarchical Modeling

, also known as

Mixed Effects Modeling,

有叫分層模型的,分層迴歸的,隨機模型的等等,你要知道它都是指的是一個東西。

這個東西就是用來分析

巢狀資料

的!————-

nested data

巢狀資料

這個時候有人就問,啥是巢狀資料啊?

These are instances in which each observation is a member of a group, and you believe that group membership has an important effect on your outcome of interest。

巢狀資料就是套著的資料,你就這麼理解,就是比如說我要分析學生學習對收入的影響,我調查了好多學校,我是不是可以很有理由的認為學校水平上的特徵也會影響學生收入?

這個時候學生就是巢狀在學校水平上的。

再來一個例子,比如我要調查焦慮和抑鬱的關係,我調查了30個人,每個人調查了5次,我得到了150個數據,那麼這些資料是不是巢狀在個人水平上的?

理解沒?

還沒有,好吧,繼續

我們收集的資料先做個散點圖:

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

我們假設上面的資料是員工的收入資料,橫軸是工作年限,縱軸是收入,我調查了整個公司的員工,員工分佈在不同部門吧,我說部門的不同會影響員工收入沒問題吧,上圖中顏色不同代表部門不同。

其實資料就是巢狀的,它是這樣的:

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

每個人巢狀在不同部門種,好,現在你要看收入和工作時間的關係,你如果不考慮巢狀,會怎麼做?

是不是你直接做個以工作時間為自變數,以收入為因變數的迴歸?

做出來就長這樣:

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

看著還行?

錯!

你這個係數根本就不準,你沒有考慮巢狀,沒有考慮部門間也就是更高水平的變異!

混合效應模型

那麼,告訴我到底怎麼做嘛,

接著看,你肯定聽過隨機斜率和隨機截距。

我們一個個來看,我剛剛說了你沒有考慮更高水平的變異,那麼這個變異情況有什麼可能,你自己想嘛,是不是有可能部門間的起薪不一樣?有可能部門間薪資增長率不一樣?或者兩個都不一樣嘛。

那麼隨機截距就是描述不同部門起薪的,加上隨機截距就意味著我們認為不同的部門起薪不一樣,可以變化,這個時候就是有隨機截距的混合效應模型:

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

在上面的描述中,個體水平上斜率是一定的,是固定效應,部門水平上可以有不同的起薪,是隨機效應。

再看隨機斜率,

就是說,有可能員工起薪都一樣只是薪資增長斜率在不同部門不一樣,要擬合這樣一個混合效應模型我們就要給模型的高水平,也就是部門水平加上隨機斜率:

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

此時我們的模型可以擬合不同部門的斜率,這個叫做隨機斜率模型。此時我們認為,個人薪資受到個人水平上的工作年限的影響和不同部門薪資增長的影響,工作年限是主效應,部門薪資增長是隨機效應。

但是我們看到,對於我們這個例子來說,只有隨機斜率似乎不太理想。

繼續看,

隨機斜率+隨機截距

也就是說更合理的情況就是每個部門的起薪和每個部門的薪資增長都是不一樣的,這種情況就是隨機截距+隨機斜率:

R資料分析:混合效應模型的視覺化解釋,再不懂就真沒辦法

這種情況下,我們就認為每個人的薪資受到部門起薪的影響,還受到部門薪資增長的影響,此時工作年限是主效應,部門起薪,部門薪資增長都是隨機效應。

如何選擇

你明白上面三種模型後,又出現問題了

那我咋知道我到底該加隨機截距還是隨機斜率啊

問的好,此時要麼你就更具理論經驗,比如我就確定部門起薪就是一樣的,那我就只加隨機斜率;還有你可以一個一個試錯,因為模型擬合出來都有擬合優度指數,你去看哪個模型的擬合優度最好你就選哪個。

小結

今天給大家寫了混合效應模型的不同型別,至於具體如何做,請看我之前的文章。感謝大家耐心看完,自己的文章都寫的很細,程式碼都在原文中,希望大家都可以自己做一做,請關注後私信回覆“資料鏈接”獲取所有資料和本人收集的學習資料。如果對您有用請先收藏,再點贊轉發。

也歡迎大家的意見和建議。

如果你是一個大學本科生或研究生,如果你正在因為你的統計作業、資料分析、論文、報告、考試等發愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問題,都可以聯絡我。因為我可以給您提供好的,詳細和耐心的資料分析服務。

如果你對Z檢驗,t檢驗,方差分析,多元方差分析,迴歸,卡方檢驗,相關,多水平模型,結構方程模型,中介調節,量表信效度等等統計技巧有任何問題,請私信我,獲取詳細和耐心的指導。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams。。 And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me。 Because I could provide you the best services for your Data Analysis。

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc。 for your Data Analysis。。。??

Then Contact Me。 I will solve your Problem。。。

加油吧,打工人!

猜你喜歡

R資料分析:混合效應模型例項

從“我醜到我自己了”說起——混合效應模型續

重複測量資料分析系列:混合效應模型基礎

R資料分析:如何計算問卷的聚合效度,例項操練

R資料分析:如何計算問卷的組合信度,例項操練

Tags:隨機模型斜率巢狀部門