TMB**突變負荷**突變負荷(TMB)作為免疫療法的生物標志物,能夠較好的預測患者免疫***的療效。基于**突變負荷,可以從一種新的角度探尋基因跟免疫及預后的關系。一般應用場景:基于TMB預測不同性狀的免疫***療效、不同基因表達或突變對免疫***潛在的影響。基本原理:**突變負荷(TumorMutationBurden,TMB),通常被定義為一份**樣本中,所評估基因的外顯子編碼區(qū)每兆堿基中發(fā)生置換和插入/缺失突變的總數(shù)。近年許多研究都報道了TMB與PD-1/PD-L1抑制劑的療效高度相關,同時基于TMB進行的臨床研究都得到了較好的結果。這讓一些**患者可以通過TMB標志物對免疫療法的療效進行一定程度的預測。結合TMB,可以從免疫***角度探尋關鍵基因、探究不同亞型**存在的不同發(fā)病機制。數(shù)據(jù)要求:基因突變數(shù)據(jù),臨床或其他分類數(shù)據(jù)。 根據(jù)委托方提供的參考文獻和要求進行個性化特定分析。天津生物/藥物信息學分析數(shù)據(jù)科學方案
GSVA算法接受的輸入為基因表達矩陣(經過log2標準化的芯片數(shù)據(jù)或者RNA-seqcount數(shù)數(shù)據(jù))以及特定基因集。**步,算法會對表達數(shù)據(jù)進行核密度估計;第二部,基于**步的結果對樣本進行表達水平排序;第三步,對于每一個基因集進行類似K-S檢驗的秩統(tǒng)計量計算;第四步,獲取GSVA富集分數(shù)。**終輸出為以每個基因集對應每個樣本的數(shù)據(jù)矩陣。無監(jiān)督算法無監(jiān)督算法常常被用于數(shù)據(jù)挖掘,用于在大量無標簽數(shù)據(jù)中發(fā)現(xiàn)些什么。它的訓練數(shù)據(jù)是無標簽的,訓練目標是能對觀察值進行分類或區(qū)分等。核密度估計核密度估計(kerneldensityestimation)在概率論中用來估計未知的密度函數(shù),屬于非參數(shù)檢驗方法之一。數(shù)據(jù)要求1、特定感興趣的基因集(如信號通路,GO條目等),列出基因集中基因2、基因表達矩陣,為經過log2標準化的芯片數(shù)據(jù)或者RNA-seqcount數(shù)數(shù)據(jù)(基因名形式與基因集對應)下游分析1、基因集(如信號通路)的生存分析2、基因集(如信號通路)的差異表達分析3、基因集。 天津診療軟件開發(fā)數(shù)據(jù)科學服務實驗室致病類病原微生物數(shù)據(jù)分析平臺。
術語解讀:PPI:蛋白質-蛋白質相互作用(protein-proteininteraction)PPImoduleI:指蛋白質相互作用模塊,一個模塊指向一個功能數(shù)據(jù)要求:基因列表應用示例1:(于2018年3月發(fā)表在Immunity.,影響因子)T細胞活化過程中產生蛋白質組進行多重定量分析,然后對差異表達蛋白權重聚類,并將聚類蛋白疊加到PPI網絡上以識別功能模塊。D.模塊大小的分布,通過將每個WPC(權重聚類結果)中的蛋白疊加到蛋白-蛋白相互作用(PPI)網絡上識別模塊。每個模塊的蛋白質數(shù)量顯示出來。E.各個模塊及其交互的關系圖。圓圈(節(jié)點)表示90個模塊,圓圈大小與模塊大小成比例。邊連接共享PPIs的模塊。在(F)和(G)中進一步擴展了裝箱模塊。F.來自WPC3的細胞質和線粒體核糖體的四個互連模塊。顯示了蛋白質的名稱和每個模塊的代表性功能術語。G.來自WPC3的蛋白酶體,OXPHOS和線粒體復合物IV途徑的模塊。
GSEA術語解讀Enrichmentscore(ES)ES是GSEA**初的結果,反應關注的基因集S在原始基因數(shù)據(jù)序列L的頂部或底部富集的程度。ES原理:掃描排序序列,當出現(xiàn)一個基因集S中的基因時,增加ES值,反之減少ES值,一個基因的ES值權重與差異表達度相關。ES是個動態(tài)值,**終ES是動態(tài)掃描過程中獲得的**ES值。如果**終ES為正,表示某一功能基因集S富集在排序序列頂部。ES為負,表示某一基因集S富集在排序序列底部。NES由于ES是根據(jù)分析的排序序列中的基因是否在一個基因集S中出現(xiàn)來計算的,但各個基因集S中包含的基因數(shù)目不同,且不同功能基因集S與原始數(shù)據(jù)之間的相關性也不同,因此比較數(shù)據(jù)中基因在不同基因集S中的富集程度要對ES進行標準化處理,也就是計算NES。NES=某一基因集S的ES/數(shù)據(jù)集所有隨機組合得到的ES平均值,NES是主要的統(tǒng)計量。nominalp-value(普通P值)描述的是針對某一功能基因集S得到的富集得分的統(tǒng)計***性,通常p越小富集性越好。FDR(多重假設檢驗矯正P值)NES確定后,需要判斷其中可能包含的錯誤陽性發(fā)現(xiàn)率。FDR=25%意味著對此NES的判斷4次可能錯1次。GSEA結果中,高亮顯示FDR<25%的富集基因集S。因為從這些功能基因集S中**可能產生有意義的假設。大多數(shù)情況下。 構建新的臨床預測模型。
術語解釋:Cox回歸:又稱比例風險回歸模型(proportionalhazardsmodel,簡稱Cox模型),是由英國統(tǒng)計學家。該模型以生存結局和生存時間為應變量,可同時分析多種因素對于生存期長短的影響。Cox模型能分析帶有截尾生存時間的資料,且不要求估計資料的生存分布類型,因此在醫(yī)學界被***使用。Logistic回歸:又稱邏輯回歸模型,屬于廣義線性模型。邏輯回歸是一種用于解決二分類問題的分析方法,用于估計某種事物的可能性。相較于傳統(tǒng)線性模型,邏輯回歸模型以概率形式輸出結果,可控性高且結果可解釋性強。數(shù)據(jù)要求:樣本臨床信息或生物學特征(基因突變、基因表達等)樣本的隨訪數(shù)據(jù)(總生存期,生存狀態(tài))或樣本的分組情況下游分析:1.補充相關因素的已有相關研究2.解釋相關因素對研究課題的意義。 云生物深度理解科研需求、強大分析處理能力。云南成果發(fā)表指導數(shù)據(jù)科學服務
云生物提供數(shù)據(jù)科學服務。天津生物/藥物信息學分析數(shù)據(jù)科學方案
ssGSEA基本原理
對于一個基因表達矩陣,ssGSEA首先對樣本的所有基因的表達水平進行排序獲得其在所有基因中的秩次rank。然后對于輸入的基因集,從基因集中尋找表達數(shù)據(jù)里存在的基因并計數(shù),并將這些基因的表達水平求和。接著基于上述求值,計算通路中每個基因的富集分數(shù),并進一步打亂基因順序重新計算富集分數(shù),重復一千次,***根據(jù)基因富集分數(shù)的分布計算p值整合基因集**終富集分數(shù)。
數(shù)據(jù)要求
1、特定感興趣的基因集(通常為免疫細胞表面marker genes),列出基因集中基因
2、基因表達矩陣,為經過log2標準化的芯片數(shù)據(jù)或者RNA-seq count數(shù)數(shù)據(jù)(基因名形式與基因集對應)
下游分析
免疫細胞浸潤分數(shù)相關性(corralation)分析 天津生物/藥物信息學分析數(shù)據(jù)科學方案