您現在的位置是:首頁 > 人文

方差分析全流程總結(單因素vs多因素+事後多重比較)

由 資料分析發燒友 發表于 人文2022-09-17
簡介輸入:一個定類欄位X(學歷)、一個或多個定量欄位Y(月收入)輸出:同一因素不同分組(如:不同的學歷X)對定量變數(如:月收入 Y)產生不產生顯著性影響案例:分析個人受教育程度(定類變數)是否給個人的經濟收入(定量變數)帶來顯著性影響LSD

spss事後檢驗怎麼做

當檢驗多個總體的均值是否相等時,方差分析是更有效的統計方法。由於是透過對資料誤差的分析來判斷均值是否相等,故名方差分析,又稱“變異數分析”或“F檢驗”,本質上它所研究的是分類自變數對數值因變數的影響。

方差分析用於定類欄位(X)與 1 個或 1 個以上的定量欄位(Y)之間的差異性研究。需要注意的是,一個定類欄位稱為單因素方差分析,兩個定類欄位及以上稱為多因素方差分析。

下面是方差分析的基本流程:

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析的型別:

方差分析按照自變數(定類欄位)個數的不同,可以分為單因素方差分析、雙因素方差分析、以及多因素方差分析。

方差分析模型需要滿足的條件:

獨立性:各組資料相互獨立、互不相關

正態性:對於偏態分佈的變數透過對數、倒數、平方根變化等方法,變為正態分佈或者近似正態分佈再來進行方差分析

方差齊性

理論上方差分析的分析變數(定量變數)Y 需要滿足正態性檢驗與方差齊檢驗,如果不滿足,建議採用非引數多獨立樣本檢驗。

正態性檢驗

方差分析要求因變數Y滿足正態分佈,可以使用SPSSPRO描述性統計——正態性檢驗,也可以使用PRO繪圖中的P-P圖/Q-Q圖/直方圖進行檢驗。

方差分析全流程總結(單因素vs多因素+事後多重比較)

理論上滿足正態分佈,但現實情況不滿足可能的原因:

抽樣樣本過少,導致總體是正態分佈,但抽樣樣本不滿足正態分佈

絕對正態分佈很難滿足,可以結合正態分佈直方圖以及峰度(絕對值小於 10)、偏度(絕對值小於 3)進一步分析,如果資料分佈基本滿足“鐘形曲線”特徵,可以描述為基本符合正態分佈。

方差分析全流程總結(單因素vs多因素+事後多重比較)

小樣本(小於50)時建議使用S-W檢驗,大樣本(大於50)時建議使用K-S檢驗

方差分析全流程總結(單因素vs多因素+事後多重比較)

1 不同分析方法案例詳解

1。1 單因素方差分析

在使用單因素方差分析時,需要每個選項的樣本量大於30。比如研究不同年齡組樣本對於研究變數的差異性態度時,年齡小於20歲的樣本量僅為20個,那麼需要將小於20歲的選項與另外一組(比如20~25歲)的組別合併為一組,然後再進行單因素方差分析。如果選項無法進行合併處理,可以考慮剔除樣本量過少的組別。

輸入:一個定類欄位X(學歷)、一個或多個定量欄位Y(月收入)

輸出:同一因素不同分組(如:不同的學歷X)對定量變數(如:月收入 Y)產生/不產生顯著性影響

案例:分析個人受教育程度(定類變數)是否給個人的經濟收入(定量變數)帶來顯著性影響

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析全流程總結(單因素vs多因素+事後多重比較)

1)正態性檢驗

根據定類變數(X)對定量變數(Y)進行分組,分別檢驗其正態性檢驗,檢視資料的總體分佈是否呈現正態性分佈(P>0。05)。通常現實研究情況下很難滿足檢驗,若其樣本峰度絕對值小於10並且偏度絕對值小於3,結合正態分佈圖可以描述為基本符合正態分佈

通常正態分佈的檢驗方法有兩種,一種是Shapiro-Wilk檢驗,適用於小樣本資料(樣本量≤5000);另一種是Kolmogorov–Smirnov檢驗,適用於大樣本資料(樣本量>5000)

方差分析全流程總結(單因素vs多因素+事後多重比較)

月收入,樣本採用Shapiro-Wilk檢驗,顯著性P值為0。022**<0。05,水平上呈現顯著性,拒絕原假設,理論上資料不滿足正態分佈,但是其峰度(-0。076)絕對值小於10並且偏度(-0。07)絕對值小於3,可以描述為基本符合正態分佈。

2)方差齊性檢驗

根據定類變數(X)對定量變數(Y)進行分組,進行方差齊性檢驗,倘若P>0。05,使用方差分析。

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差齊性檢驗的結果顯示,對於時間,顯著性P值為0。202,水平上不呈現顯著性,不能拒絕原假設,因此資料滿足方差齊性。

3)方差分析結果

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析結果 p值為0。000***≤0。05,因此統計結果顯著,說明不同的學歷在月收入上存在顯著差異。

摘要單因素方差分析:

一般進行單因素方差分析需要原始資料進行分析,但有時沒有原始資料,如資料缺失或者驗證論文時。此時只有樣本量,平均值,標準差這樣的彙總資料,可以使用摘要單因素方差分析檢驗差異是否顯著。

方差分析全流程總結(單因素vs多因素+事後多重比較)

1。2 雙因素方差分析

單因素方差分析只考慮一個定類自變數對定量因變數的影響。但在現實研究中,一個變數的影響可能不足以說明差異效果,當方差分析中涉及兩個定類自變數時,稱為雙因素方差分析,用於分析兩個自變數對因變數帶來的顯著性影響。

雙因素方差分析包括無互動作用和有互動作用兩種:

無互動作用的雙因素方差分析假定兩個因素的效應之間相互獨立,不存在相互關係;

有互動作用的雙因素方差分析假定兩個因素的結合會產生出一種新的效應。

比如我們大家所熟知的,牛奶和藥是不可以一起吃的,如果單獨喝牛奶有助於身體蛋白質的補充,如果單獨吃藥可以有助於治療病症,但是牛奶和藥同時吃就會把兩者的作用抵消掉。這種兩者之間的相互作用就可以理解成是互動作用,當然了,有的時候互動是正向呢,有的時候是負向的。

下面介紹的為無互動作用的雙因素方差分析,有互動作用的方差分析需考慮互動作用項,系統提供了帶有互動作用的雙因素方差分析。

輸入:兩個定類變數(如電腦的品牌和生產地區)與一個定量變數(如電腦銷量)。

輸出:模型雙因素方差分析的結果:變數一對定量變數產生/不產生顯著性影響,變數二對定量變數產生/不產生顯著性影響。

案例:分析品牌和地區兩個定類自變數對電腦銷量(定量因變數)的影響。

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析全流程總結(單因素vs多因素+事後多重比較)

1) 雙因素方差分析結果

方差分析全流程總結(單因素vs多因素+事後多重比較)

對於變數品牌、地區,從F檢驗的結果分析可以得到,顯著性P值為0。000***水平上呈現顯著性,對結果有顯著性影響,存在主效應,可以進一步分析事後多重分析結果。

2) 均值對比圖

方差分析全流程總結(單因素vs多因素+事後多重比較)

上圖展示了雙因素方差分析的均值的結果,透過比較不同分組變數的均值以及交叉情況(通常有交叉則有互動作用),可以挖掘其差異關係。

1。3 三因素方差分析

三因素方差分析是檢驗在三種因素影響下,三個以上總體的均值之間是否相等的一種統計方法。包括無互動影響和有互動影響的情況。

下面介紹為無互動影響的三因素方差分析,若需分析有有互動影響的情況,只需在上面案例操作 step6:進行相關設定即可。

輸入:三個定類變數(如電腦的品牌、廣告形式和生產地區)與一個定量變數(如電腦銷量)

輸出:模型三因素方差分析的結果:變數一對定量變數產生/不產生顯著性影響,變數二對定量變數產生/不產生顯著性影響,變數三對定量變數產生/不產生顯著性影響,均值對比圖。

案例:分析品牌、地區和廣告形式三個定類自變數對電腦銷量(定量因變數)的影響。

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析全流程總結(單因素vs多因素+事後多重比較)

1)三因素方差分析結果

方差分析全流程總結(單因素vs多因素+事後多重比較)

對於變數截距、品牌、地區,從F檢驗的結果分析可以得到,顯著性P值為0。000***水平上呈現顯著性,對結果有顯著性影響,存在主效應。

對於變數廣告形式,從F檢驗的結果分析可以得到,顯著性P值為0。915水平上不呈現顯著性,對結果沒有顯著性影響,不存在主效應。

2)均值對比圖

方差分析全流程總結(單因素vs多因素+事後多重比較)

上圖展示了三因素方差分析的均值的結果,透過比較不同分組變數的均值以及交叉情況(通常有交叉則有互動作用),可以挖掘其差異關係,右上角可以進行對比切換。

多因素方差分析可使用SPSSPRO引數檢驗——多因素方差分析,這裡就不進行案例展示了。

方差分析全流程總結(單因素vs多因素+事後多重比較)

1。4 事後多重比較

方差分析的結果只能檢驗出三個以上的總體均值完全相同或不完全相同。當不完全相同時,至於是哪個或哪些總體均值與其它總體均值不同則是不能獲知的。因此方差分析結束以後還需要做事後多重檢驗,分析出到底是哪個或哪些總體均值與眾不同。

我們採用單因素方差分析的案例來進行事後多重比較的演示。

輸入:一個定類欄位X(學歷)、一個或多個定量欄位Y(月收入)

輸出:同一因素不同分組(如:不同的學歷X)對定量變數(如:月收入 Y)產生/不產生顯著性影響

案例:分析個人受教育程度(定類變數)是否給個人的經濟收入(定量變數)帶來顯著性影響

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析全流程總結(單因素vs多因素+事後多重比較)

LSD法:最小顯著性差異法,是最簡單的比較方法之一

1)方差分析結果

方差分析全流程總結(單因素vs多因素+事後多重比較)

方差分析的結果顯示,對於變數月收入,顯著性P值為0。000***,水平上呈現顯著性,拒絕原假設,說明變數月收入在學歷之間存在顯著性差異,需要進行事後多重比較。

2)方差分析對比圖

方差分析全流程總結(單因素vs多因素+事後多重比較)

上圖展示了方差分析的均值的結果,透過比較均值,可以挖掘其差異關係,一般結合輸出結果三共同分析。

3)事後多重比較結果

方差分析全流程總結(單因素vs多因素+事後多重比較)

使用LSD方法的事後多重比較的結果顯示: 對於變數月收入,均值大小排序為:大學>高中>初中>無。其中初中與大學、初中與高中、大學與無、大學與高中存在顯著性差異。

注意:

如果輸入的定類變數僅兩類,則一般不進行事後多重比較;

如果方差分析的結果P值大於0。05,說明各類之間沒有差異性,則不需要進行事後多重比較;

儘量在方差齊性時進行方差分析甚至兩兩比較。

推薦文章