表达谱(芯片数据)基础分析

询价
2021-07-23 17:49

上海源兹生物科技有限公司

我要认领
上海源兹生物科技有限公司
林小姐
18516079041 021-64065237
linweiwei@yzibio.com
产品属性
服务名称生物信息学分析服务
提供商上海源兹生物科技有限公司
规格询价
产品说明

如需其他分析详见其他产品,下图示例

数据和方法

  • 表达谱数据来源
数据来自于NCBI GEOGene Expression OmnibusGEOhttp://www.ncbi.nlm.nih.gov/geo/[]数据库,数据系列号为GSE***(物种:***。数据共有***个样本数据。样本全部采用GPL*** ***Array平台检测。
  • 原始数据预处理
对于下载得到的原始CEL格式的表达谱数据,利用R version 3.3.2)软件包oligo[]对数据进行表达值背景矫正和表达谱数据的归一化预处理,包括原始数据格式的转换,缺失值补充,背景矫正(MAS法),以及用分位数法(quantiles)进行数据标准化。
差异表达基因筛选
将基因表达矩阵分为case组和control组,筛选差异表达基因。使用limma[]提供的非配对T检验的方法计算基因表达差异的显著性P采用BH矫正P对于每个显著差异表达基因,要求P小于0.05|logFC|>0.5。使用R软件包pheatmap[]来绘制差异表达基因热图。

三、差异表达基因富集通路分析

使用常用的富集分析工具DAVID[]Version6.8, http://david-d.ncifcrf.gov/)分别分析上调和下调差异表达基因参与的Gene Ontology[]功能富集、KEGG通路[]功能富集。参数富集基因个数count>=2,超几何检验显著性阈值Pvalue<0.05(视为显著富集结果)。

四、差异表达基因的PPI网络

结合STRING((Version10.0, http://www.string-db.org/))[]数据库预测分析差异表达基因编码蛋白之间是否存在互作关系。输入基因集为差异表达基因,物种为Saccharomyces cerevisiae。参数PPI score设为0.4(表示Medium confidence),要求发生互作的蛋白质节点均为差异表达基因。构建差异表达基因的PPI网络构建网络软件为Cytoscapevesrion3.2.0[]
利用网络拓扑性质指标Degree Centrality来分析节点在网络中的得分。节点得分越高表示在网络中的位置越重要,越有可能是关键节点。
我们对可能的关键节点,即degreeTOP10genecase组和control的表达水平做条形图。

五、子网络模块

单个的基因往往不会独自发挥作用,它们可能通过与别的对象互作,共同作用下才能发挥调节作用。而同在一个模块中的基因产物蛋白质往往具有相同的或者相似的功能,它们作为一个模块在行使着同一个生物学作用。使用cytoscape的插件MCODE[]方法分析网络中最显著聚类的模块。

六、miRNA和疾病靶基因调控网络分析

随着RNA干扰机制(RNAi)的发现非编码RNA在基因表达和调控方面的功能受到了很大的关注miRNA因其与生物体的多项调控功能有着密切联系而成为关注重点。miRNA主要通过与其靶基因相互作用进而调控基因的表达
我们通过webgestal[](http://www.webgestalt.org/option.php), 采用Overrepresentation Enrichment Analysis(ORA)富集方法,分别对上调和下调的差异表达基因进行miRNA-target富集预测,分别获得TOP10的结果,整理得到全部的miRNA-targets关系对,并使用cytoscape软件构建miRNA-target调控网络。



分析结果
  • 差异表达分析基本信息统计
对数据进行预处理后(附表1),见图1,该数据共有***个探针,多个探针对应一个symbol,我们取平均值作为该gene的表达值,对探针注释之后获得***gene,(见附表2),limma包检验后获得差异表达基因***个(详情见附表3),其中显著上调的差异表达基因***个,显著下调的差异表达基因***个,对差异表达基因做热图,见图2(使用数据见附表4)。
  • 差异表达基因功能富集结果
上调差异表达基因显著富集KEGG通路和GO结果见表1:上调基因显著富集了3KEGG pathway5GO-BP5GO-CC没有富集到显著的GO-MF结果;下调差异表达基因显著富集KEGG通路结果和GO见表2:下调基因没有富集到显著的KEGG pathway结果,显著富集到23GO-BP10GO-CC10GO-MF结果。显著富集结果结果较多的,按照P值从小到大排列,取TOP5作结果展示。(详情见附件1)。
1 上调差异表达基因显著富集的 KEGG PathwayGO结果
IDNameCountPValue
KEGG_PATHWAYsce00230Purine metabolism61.65E-02
sce01100Metabolic pathways182.29E-02
sce00330Arginine and proline metabolism34.30E-02
GO_BPGO:0000096sulfur amino acid metabolic process33.47E-03
GO:0000165MAPK cascade31.77E-02
GO:0090630activation of GTPase activity32.10E-02
GO:0071555cell wall organization63.31E-02
GO:0007165signal transduction54.39E-02
GO_CCGO:0031225anchored component of membrane65.68E-03
GO:0005887integral component of plasma membrane85.97E-03
GO:0005886plasma membrane171.03E-02
GO:0000324fungal-type vacuole121.15E-02
GO:0016020membrane422.00E-02
Count<1010—2020—30>30
PValue0.05-0.010.01-0.0010.001-1.E-09<1.E-09

2 下调差异表达基因显著富集的 KEGG PathwayGO结果(TOP5
IDNameCountPValue
GO_BPGO:0015891siderophore transport72.53E-10
GO:0055085transmembrane transport201.26E-09
GO:0055072iron ion homeostasis95.85E-09
GO:0006811ion transport141.54E-08
GO:0006810transport311.02E-06
GO_CCGO:0071944cell periphery302.89E-18
GO:0005576extracellular region163.45E-11
GO:0005886plasma membrane284.07E-10
GO:0009277fungal-type cell wall147.57E-09
GO:0005618cell wall113.95E-08
GO_MFGO:0008559xenobiotic-transporting ATPase activity43.15E-04
GO:0042626ATPase activity, coupled to transmembrane movement of substances44.60E-03
GO:0005215transporter activity66.73E-03
GO:0005355glucose transmembrane transporter activity47.89E-03
GO:0005351sugar:proton symporter activity47.89E-03
Count<1010—2020—30>30
PValue0.05-0.010.01-0.0010.001-1.E-09<1.E-09
  • 差异表达基因PPI网络
PPI网络见图3,共有***个节点,***个互作关系对。拓扑得分高,可视作网络关键节点,degree值(TOP10)见表3。这***个基因在case组和control组的表达水平见图4,表达量为各组的平均值,error barSDstandard deviation)。(STRING网站下载文件见附表5,各节点degree值见附表6TOP10gene表达水平详情见附表7)。

3 PPI网络degreeTOP10差异表达基因列表
NodeSLT2DDR2HSP26HXT5TMA10HXK1FMP16BDH2ECM4GAP1
Descriptionupdowndowndowndowndowndowndownupup
Degree26252423232221212120
  • 网络聚类模块
应用cytoscape插件MCODE[]获得score>52个显著聚类的模块ab。模块ascore9.556)包含10个节点,43个互作关系对;模块bscore8.5)包含9个节点,34个互作关系对。模块均没有显著富集到KEGG pathway,模块a显著富集到2BP结果,模块b显著富集到9BP结果,见表4。(见附件2
4 模块显著富集的GO-BP结果
IDNameCountPValue
Module aGO:0034605cellular response to heat35.43E-04
GO:0046323glucose import23.72E-02
Module bGO:0055072iron ion homeostasis83.84E-16
GO:0006811ion transport93.49E-14
GO:0015891siderophore transport67.10E-14
GO:0006879cellular iron ion homeostasis51.93E-07
GO:0044718siderophore transmembrane transport31.81E-05
GO:0015677copper ion import39.91E-05
GO:0006810transport72.21E-04
GO:0006826iron ion transport21.57E-02
GO:0055085transmembrane transport34.38E-02
  • miRNA-target调控网络
通过webgestal分别获得上调和下调的miRNA-target调控关系对(上调结果见附表8,下调结果见附表9,整理后调控关系对见附表10),结果如图7所示,网络图中包含64个节点,102个互作关系对,包括106个差异表达基因,其中上调基因28个、下调基因11个和25miRNA。(miRNA-target degree详情见附表11