您現在的位置是:首頁 > 飲食

【老生常談】P值是如何來的!

由 小道資訊分享 發表于 飲食2022-01-04
簡介圖2 F分佈統計學方法-Significance ABSignificance A也是經常出沒的一種統計學方法,該演算法主要是根據兩組樣本表達量的RATIO進行正態分佈排列,利用Significance ratio score計算的到顯著性

老生兒代表什麼樣的人

【老生常談】P值是如何來的!

一入組學深似海,結果不離“差異”門

統計學方法計算P值

不管P<0。05還是P<0。005哪個使用更合理,首先得會計算P值。

組學中計算P值的方法很多,包括

常用統計學方法有t-test、one-way ANOVA、two-way ANOVA 、significanceA/B、Z-test等

,如何選擇,請往下看。

統計學方法之-two sample t test

T檢驗,又叫student t檢驗(Student‘s t test)。即用t分佈(見圖1)理論來推論差異發生的機率,從而比較兩組樣本均值差異是否顯著,感興趣的童鞋可以仔細看一下下圖。

該統計學方法適用於3個及以上獨立重複樣本,用Spss或者excel等軟體完成。

舉個例子,

比如您有一組野生型菌株和一組突變型菌株,各有四個重複,目標是比較兩種型菌株的蛋白質表達差異,那選擇用T檢驗再合適不過了。

【老生常談】P值是如何來的!

圖1 雙側檢驗T分佈

統計學方法-one sample t test

上面提到的是比較經典的 T 檢驗,適用於兩樣本之間的顯著性檢驗。

而這裡再介紹一種one sample T test,用於比較一個樣本總體均值與特定數值之間是否存在統計學上的差異。

比如我們有兩組資料,分別是野生型菌株和突變型菌株,野生型與突變型的表達量比較之後,得出一個兩者表達量的比值。一切都看起來很正常。

重點在這裡,採用one sample T 檢驗的方法進行顯著性分析,那就是用表達量的ratio和1進行比較。

如果兩組之間沒有顯著差異,則比值在1附近,p value值可能就大於0。05。如果兩組之間有比較大的差異,與1偏離較大,p value可能就非常小。p小於0。05以 後,小機率事件都已經發生了,你說顯著不顯著?

【老生常談】P值是如何來的!

統計學方法-ANOVA分析

是R。A。Fisher發明的,又叫F檢驗。即用F分佈(見圖2)理論來推論不同處理因素對各組樣本均值間的差異。只考慮一種因素用one-way ANOVA, 考慮兩種因素以及互動作用用two-way ANOVA,該差異比較的實現方法就要到一些特殊的手段和程式啦。

適用範圍是生物學重複大於或等於3的兩組或者多組樣本的顯著性檢驗。

為了方便大家理解,舉一個栗子,比如不同時長的光照處理對植物花期的影響,那影響因素是什麼呢,就是不同時長的光照,植物還是那個植物,處理了不同時間的光照,一定會有些蛋白質會發生變化。那我們透過one-way ANOVA分析之後,就可以得出哪些蛋白質是受光照處理影響的蛋白質。情況再複雜一點,如果該植物又是來源不同的兩種形態,比如耐寒性和不耐寒型,那是不是就變成了兩個因素,一個是光照,一個是耐寒性。那這個時候我想比較在兩種植物中的受光照影響的蛋白質,那就應該選擇two-way ANOVA,雙因素方差分析啦。

【老生常談】P值是如何來的!

圖2 F分佈

統計學方法-Significance A/B

Significance A也是經常出沒的一種統計學方法,

該演算法主要是根據兩組樣本表達量的RATIO進行正態分佈排列,利用Significance ratio score計算的到顯著性的p value,將明顯離群的點作為差異候選。

Significance B 計算公式與Significance A 相同,但是會根據強度值劃分區間分別進行顯著性計算,從而得到顯著性的p value。是不是有點拗口呢?

簡單理解就是Significance B會比Significance A計算演算法原理相同,但是計算更精細,考慮到不同丰度對顯著性的影響。

如下圖。至於計算公式比較複雜,感興趣的童鞋可以去找一下文章,仔細研究一下。

【老生常談】P值是如何來的!

圖3 significance B示意圖

統計學方法-Z檢驗

Z檢驗是一般用於大樣本(即樣本容量大於30)平均值差異性檢驗的方法,

請看以下公式。

它是用標準正態分佈的理論來推斷差異發生的機率,從而比較兩個平均數的差異是否顯著。

Z檢驗和T檢驗都是用均值差異檢驗的方法。

但是t檢驗的運用要比z檢驗更廣泛,因為大小樣本時都可以用T檢驗,

而小樣本時Z檢驗就不太適用了。

目前Z檢驗沒有大規模使用,大家知道就可以了。所以咱們就不舉栗子了,行不?

其Z值計算公式為:

其中:

是檢驗樣本的平均數;

μ0是已知總體的平均數;

S是樣本的標準差;

n是樣本容量。

以上主要是統計學方法的內容,大家看明白了嗎?

不管以上哪一種方法,在分析思路上都有以下三大步:

首先,

對樣本進行分組,定義好組內和組間。

然後,

利用統計分析軟體計算P-value,也就是計算出當原假設成立條件下,樣本觀察結果或者更極端結果出現的機率。

最後,

判斷否接受原假設,即當p小於0。05或者0。01時為差異有統計學意義,說明樣本之間差異顯著。

下期我們將給大家講解

差異蛋白質篩選標準!

【老生常談】P值是如何來的!

推薦文章