您現在的位置是:首頁 > 娛樂

國科風教你單細胞測序(12):分析流程(五)

由 國科風實驗室耗材 發表于 娛樂2022-07-23
簡介SAVER:該方法透過表達恢復進行單細胞分析,該方法基於貝葉斯模型,借用跨基因和細胞的資訊來插補零值並改善所有基因的表達(如使用質量控制後的具有 UMI 計數的 scRNA-seq 資料)

測序分析核型圖怎麼看

國科風教你單細胞測序(12):分析流程(五)

大家好!我是國科東方綠豪克,我是生命科學方向的博士。

進行完單細胞資料標準化後,就要進行後續的降維(Dimensionality Reduction)和細胞亞群的鑑定等後續分析。但在進行這些後續分析前,還需要進行 scRNA-seq 資料的 imputation(Imputation of ScRNA-seq Data)。

那麼為什麼要進行單細胞資料的 imputation 呢?這其中主要與 Dropouts 有關,因為在單細胞 RNA-seq 實驗過程中,會產生因原始 RNA 擴增失敗而導致的缺失值(droputs)。

前面的內容已經講過,dropouts 主要跟實驗選擇的方案有關,也與每個細胞測序的 reads 量相關。因為實驗過程中產生的 dropouts,導致後續分析中增加了細胞間的變異。同時對每個基因而言,導致基因表達分析失去真實性,也對基因間調控網路的分析存在誤差。這些無法檢測到 dropouts,對後續的分析將有很大的影響,因此需要採用一些演算法來進行 imputation,從而保證下游分析的正確性。

下面我給大家介紹集中 imputation 的方法,imputation 是一種用替代值替換缺失資料的有效方法。

1。 SAVER:

該方法透過表達恢復進行單細胞分析,該方法基於貝葉斯模型,借用跨基因和細胞的資訊來插補零值並改善所有基因的表達(如使用質量控制後的具有 UMI 計數的 scRNA-seq 資料)。

使用 SAVER 後,利用 Seurat 對參考、觀察和恢復的資料集進行細胞聚類,SAVER 的聚類準確性要明顯高於 MAGIC 和 Sclmpute(這兩種方法後面會介紹)。同時對小鼠視覺皮層細胞資料進行分析,利用 SAVER 進行 imputation 後,可以清晰地區分各種亞型細胞類群,而未進行SAVER的資料,則幾乎無法區分亞型。

國科風教你單細胞測序(12):分析流程(五)

2。 MAGIC:

MAGIC(Markov affinity-based graph imputation of cells)方法基於馬爾可夫親和力的細胞圖插補法,透過資料擴散的方式在相似細胞間共享資訊。

下圖為 MAGIC 的插補流程,利用 MAGIC 方法可以恢復資料中較精確的表型結構,使後續的發育軌跡和聚類都可以有很好的結果。同時,該方法還在不同的生物系統和測量技術中得以驗證,表明 MAGIC 是進行資料 imputation 良好的工具。

國科風教你單細胞測序(12):分析流程(五)

3。 Sclmpute:

Sclmpute 相比 SAVER 和 MAGIC,可以在不引入新的偏差的情況下計算 dropout 值。該方法考慮到 SAVER 和 MAGIC 可能將細胞中未受 dropout 影響的基因進行恢復,所以 sclmpute 利用混合模型來定位可能的缺失值,之後對其進行插補。具體的原理如下圖所示:

國科風教你單細胞測序(12):分析流程(五)

利用模擬資料進行評比,Sclmpute 較 MAGIC 和 SAVER,在進行完 imputation 後,細胞類群的分析結果更好。

國科風教你單細胞測序(12):分析流程(五)

同時,在 PBMC 資料集中利用 Sclmpute 進行 imputation 後,細胞亞群的分析結果有較為明顯的提升,也表明該方法具有很好的 imputation 效果。

推薦文章