快递查询
测试调用测试设计Survival生存曲线绘制软件环境微生物多样性软件转录组分析软件转录组软件购买重测序软件环境微生物多样性软件(1)桌面软件中药空间代谢组学检测中药非靶代谢组检测中药入血/入靶成分分析中药成分鉴定检测中药组学ATAC-seqCHIP-seqHi-C测序基因调控OmicsBeanMicrobe Trakr(微生物基因组鉴定分析工具)网页分析系统WEB分析系统澳洲血清 BovineBD科研管KAPAQIAGENThermoFisherMVE液氮罐4titude® 样品管标记系统Hi-C建库试剂盒及基因组组装软件无血清细胞冻存液Cell Freezing Medium纳米流式检测仪lexogen支原体检测试剂盒仪器试剂耗材数据库开发数据中心TCGA生存数据包功能医学报告系统开发PlantArray植物生理组平台特色服务单细胞测序空间代谢组DSP空间蛋白质组Visium空间转录组测序空间多组学类器官基因芯片染色体级别基因组组装Hi-C建库叶绿体、线粒体基因组测序一代测序动植物基因组de novo测序细菌基因组测序真菌基因组测序病毒基因组测序简化基因组遗传图谱测序简化基因组GWAS测序基因组重测序表观组基因分型外显子捕获目标区域捕获简化基因组遗传图谱性状定位扫描图DNA中5-hmC图谱测定全基因组甲基化测序真菌基因组扫描图测序epiGBS-简化甲基化BSA混池测序基因组SSR开发基因组(DNA)UMI-RNAseq转录组测序真核有参转录组测序真核无参转录组测序原核链特异性转录组测序全转录组测序 降解组表达谱芯片circRNA芯片circRNA测序Small RNA测序Lnc RNA测序m6A甲基化测序互作转录组测序UMI-RNAseq转录组(RNA)16S扩增子全长测序Meta-Barcoding(eDNA)技术研究微生物多样性测序宏基因组测序宏基因组Binning分析宏基因组抗性基因测序HiC-Meta宏基因组宏转录组差异表达测序宏病毒组测序环境DNAHiFi-Meta宏基因组肠道菌群临床检测基于肠道菌群检测和移植的肠道微生态学科建设宏基因组元素循环测序微生物组蛋白组代谢组抗体芯片Raybiotech芯片蛋白芯片蛋白芯片4D蛋白质组Raybiotech芯片OLINK精准蛋白质组学解决方案常规定量蛋白质组蛋白质组定性分析靶向蛋白质组学修饰蛋白质组学非靶向代谢组学靶向代谢组学脂质组学蛋白和代谢组GC-MS全代谢组LC-MS全代谢组靶向代谢组脂质组学代谢组学分子生物学CRISPR基因编辑细胞定制细胞株构建iPS构建CRISPR/Cas9DNA甲基化修饰细胞FAQ基因编辑切片图像扫描组织芯片免疫组化微量基因组建库专家病理切片数字存档多色免疫荧光病理形态学数据陪护扩增子时序分析基因突变体克隆动物中心小动物疾病模型构建和检测服务基因编辑小鼠动物实验支原体污染检测服务细胞系遗传背景鉴定细胞系鉴定外泌体全转录组测序外泌体分离与鉴定单外泌体蛋白质组学分析服务外泌体专题甲基化焦磷酸测序cfDNA甲基化测序DNA甲基化测序850K甲基化芯片935K甲基化芯片全基因组甲基化测序(WGBS)简化基因组甲基化测序 (RRBS)目标区域甲基化测序 (Targeted Bisulfite Sequencing)甲基化DNA免疫沉淀测序 (MeDIP-seq)氧化-重亚硫酸盐测序 (oxBS-seq)TET-重亚硫酸盐测序(TAB-seq)5hmC-Seal,超高灵敏度的羟甲基化检测羟甲基化免疫共沉淀测序 (hMeDIP-seq)DNA 6mA免疫沉淀测序 (6mA-IP Seq)甲基化专题RNA修饰研究专题免疫印迹(Western-blot)技术服务定量Western检测Simoa单分子免疫分析qPCRCNVSNPPGM测序PCR array数字PCR精准检测ATAC-SeqChIP-SeqRIP-Seq基因调控Ribo-seq核糖体印迹测序技术Active Ribo-seq活跃翻译组测序技术翻译组10x官方发布样本准备样本要求样本取材以及样本编号技巧精简版细胞库组织库动物模型蛋白组代谢组Hi-C单细胞与空间转录组单细胞悬液外泌体Raybiotech蛋白芯片Simoa样本准备样本准备要求表单留言板SaaS 帮助搜索Mac谷歌浏览器2019国自然基金查询生信相关工具集合数据分析项目信息单提交资料分享核酸抽提产品资料转录组软件教学视频微生物多样性软件教学视频Lexogen产品培训视频Olink精准蛋白组学专题项目进度个人中心会员登录会员注册购物车联系我们公众号手机商城公司愿景知识分享
商城导航
  • 仪器
    细胞计数仪细胞复苏仪
    细胞计数仪
    细胞复苏仪
  • 蛋白芯片
    高通量系列芯片抗体芯片通路芯片糖芯片蛋白芯片流式多因子试剂盒
    高通量系列芯片
    抗体芯片
    通路芯片
    糖芯片
    蛋白芯片
    流式多因子试剂盒
  • 试剂
    逆转录酶qPCR Mix启衡星类器官培养流式多因子ELISA试剂盒BDKAPALexogen
    逆转录酶
    qPCR Mix
    启衡星
    类器官培养
    流式多因子
    诊断试剂产品
    Human
    Human PD Panels
    Mouse
    Mouse PD Panels
    ELISA试剂盒
    人ELISA试剂盒
    大鼠ELISA试剂盒
    小鼠ELISA试剂盒
    辅助试剂
    BD
    BD Vacutainer® CPT™
    PAXgene 全血RNA 管
    BDTM P800
    BD™ P100
    KAPA
    Lexogen
    血清
    磐超P&C
    外泌体CD63 & TSG101 蛋白检测试剂盒
    BioEcho
    免疫荧光试剂盒
  • 细胞
    CRISPR定制杂交瘤细胞肝癌系(株)肺癌系(株)乳腺癌系(株)胃癌系(株)结肠癌系(株)食管癌系(株)口腔鼻咽癌系(株)
    CRISPR定制
    杂交瘤细胞
    肝癌系(株)
    肺癌系(株)
    乳腺癌系(株)
    胃癌系(株)
    结肠癌系(株)
    食管癌系(株)
    口腔鼻咽癌系(株)
    卵巢癌系(株)
    绒毛癌系(株)
    膀胱癌系(株)
    宫颈癌系(株)
    前列腺癌系(株)
    畸胎瘤系(株)
    皮肤癌系(株)
    肾癌系(株)
    淋巴骨髓瘤系(株)
    胶质瘤系(株)
    黑色素瘤系(株)
    白血病系(株)
    肉瘤系(株)
    神经母细胞瘤系(株)
    涎腺腺样囊性癌系(株)
    甲状腺癌系(株)
    胰腺癌系(株)
    胆囊癌系(株)
    小肠癌系(株)
    间皮瘤系(株)
    垂体瘤细胞
    肥大细胞瘤细胞
    腹水瘤细胞
    脑瘤细胞
    肿瘤细胞
    正常细胞系(株)
  • 耗材
    样本保存液(游离DNA保存管)口腔拭子采集套装一次性使用采集拭子病毒采样套装唾液样本采集套装尿液采集器粪便采集器HPV自采样宫颈刷
    样本保存液(游离DNA保存管)
    口腔拭子采集套装
    一次性使用采集拭子
    病毒采样套装
    唾液样本采集套装
    尿液采集器
    粪便采集器
    HPV自采样宫颈刷
  • 科研课题设计
  • 数据分析
    分析模块软件系统
    分析模块
    模块套装
    单模块
    分析代码
    软件
    系统
    数据库
    数据分析系统
当前位置
GSEA分析
收藏
|
GSEA分析
价格:
1000.00
服务时间: 5个工作日
购买数量:
产品详情
产品评论(0)

152782808b0081591889f03440bfc6e.png——GSEA代码


GSEA全名为Gene Set Enrichment Analysis(基因集富集分析)。用以分析特定基因集(如关注的GO条目或KEGG Pathway)在两个生物学状态(如癌症与对照,高龄与低龄)中是否存在差异。能够研究基因变化的生物学意义。

普通GO/KEGG富集的思路是先筛选差异基因,然后确定这些差异基因的GO/KEGG注释,然后通过超几何分布计算出哪些通路富集到了,再通过p值或FDR等阈值进行筛选。挑选用于富集的基因有一定的主观性,没有关注到的基因的信息会被忽视,所以有一定的局限性。

在这种情况下有了GSEAGene Set Enrichment Analysis),其思路是发表于2005年的Gene set enrichment analysis: aknowledge-based approach for interpreting genome-wide expression profiles。主要是要有两个概念:预先定义的基因集S(基于先验知识的基因注释信息)和待分析基因集L(一般初始输入是表达矩阵);然后GSEA目的就是为了判断S基因集中的基因是随机分布于L(按差异表达程度对基因进行排序),还是聚集分布在L的顶部或者底部(也就是存在差异性富集)。如果基因集中的基因显著富集在L的顶部或者底部,这说明这些基因的表达对定义的分组(预先分组)的差异有显著影响(一致性)。在富集分析的理论中,GSEA可以认为是第二代,即Functional Class Scoring(FCS) Approaches

基本原理

从方法上来讲,GSEA主要分为基因集进行排序、计算富集分数(Enrichment ScoreES)、估计富集分数的显著性水平并进行多重假设检验三个步骤。

**步对输入的所有基因集L进行排序,通常来说初始输入的基因数据为表达矩阵,排序的过程相当于特定两组中(case-controlupper-lower等等)基因差异表达分析的过程。根据所有基因在两组样本的差异度量不同(共有六种差异度量,默认是signal 2 noiseGSEA官网有提供公式,也可以选择较为普遍的foldchange),对基因进行排序,并且Z-score标准化。

第二步是GSEA的核心步骤,通过分析预先定义基因集S在**步获得的基因序列上的分布计算富集指数Enrichment Score,并绘制分布趋势图Enrichment plot。每个基因在基因集SEnrichment Score取决于这个基因是否属于基因集S及其差异度量(如foldchange)。差异度量越大基因的Enrichment Score权重越大,如果基因在基因集S中则Enrichment Score取正,反则取负。将基因集L在基因集S里的所有基因的Enrichment Score一个个加起来,就是Enrichment plot上的Enrichment Score趋势,直到Enrichment Score达到**值,就是基因集S最终的Enrichment Score

第三步是为了检验第二部获得结果的统计学意义,对Enrichment Score进行标准化,计算标准化Enrichment ScoreNES)。并计算显著性水平(NOM p-val)和矫正多重假设检验显著性水平(FDR q-val)。

GSEA术语解读

Enrichment scoreES

ESGSEA最初的结果,反应关注的基因集S在原始基因数据序列L的顶部或底部富集的程度。ES原理:扫描排序序列,当出现一个基因集S中的基因时,增加ES值,反之减少ES值,一个基因的ES值权重与差异表达度相关。ES是个动态值,最终ES是动态扫描过程中获得的**ES值。如果最终ES为正,表示某一功能基因集S富集在排序序列顶部。ES为负,表示某一基因集S富集在排序序列底部。

NES

由于ES是根据分析的排序序列中的基因是否在一个基因集S中出现来计算的,但各个基因集S中包含的基因数目不同,且不同功能基因集S与原始数据之间的相关性也不同,因此比较数据中基因在不同基因集S中的富集程度要对ES进行标准化处理,也就是计算NES

NES=某一基因集SES / 数据集所有随机组合得到的ES平均值,NES是主要的统计量。

nominal p-value(普通P值)

描述的是针对某一功能基因集S得到的富集得分的统计显著性,通常p越小富集性越好。

FDR(多重假设检验矫正P值)

NES确定后,需要判断其中可能包含的错误阳性发现率。FDR=25%意味着对此NES的判断4次可能错 1次。GSEA结果中,高亮显示FDR<25%的富集基因集S。因为从这些功能基因集S中最可能产生有意义的假设。大多数情况下,筛选FDR<25%是合适的,但是,假如分析的数据集样本较少,且选择的是探针随机组合而不是表型组合,则应该酌情选择更加严格的FDR阈值。一般而言,NES绝对值越大,FDR值就越小,说明富集程度高,结果更加可靠。

数据要求

1、通常为表达谱芯片或测序数据(已经过预处理),也可以是其他形式可排序的基因数据。

2、具有已知生物学意义(GOPathway、癌症特征基因集等)的基因集。

下游分析:

得到GSEA结果之后的分析有:

1.   基因注释

2.   PPI基因相互作用分析与互作网络绘制

3.   GSVA分析

图形示例:

1、绘制基因集富集趋势图(Enrichment plot

1.png

图注

横坐标:按差异表达差异排序的基因序列。数值越小(偏向左端)的基因代表在shICAM-1组中有越高倍数的差异表达,数值越小(偏向右端)的基因在对照组中有越高倍数的差异表达。

纵坐标:上方的纵坐标为富集打分ES,ES是一个动态的值,沿着基因序列,找到条目中的基因则增加评分,否则减少评分。通常用偏离0最远的值作为最终富集打分。下方的纵坐标代表基因表达与表型的关联,绝对值越大代表关联越强,数值大于0代表正相关,小于0则代表负相关。

2、绘制功能基因集S中基因在数据中的表达热图

2.png

图注:根据基因表达量作图,每个小方格表示特定基因在特定样本中的表达量,其颜色表示该基因表达量大小,颜色从红到蓝代表表达量从高到低。图片右侧标注基因信息,上方标注样本信息,色块分区代表样本分组。

应用示例:

文献1:A seven-miRNA expression-based prognosticsignature and its corresponding potential competing endogenous RNA network inearly pancreatic cancer.(于2019年7月发表在影响因子1.448

3.png

早期胰腺癌中的基于7-miRNA表达量的预后预测模型及其ceRNA网络分析

为了研究挑选出的7-miRNA预后模型的生物学意义,作者通过GSEA分析查找受7-miRNA表达值影响的KEGG Pathway。并挑选了富集的KEGG Pathway中的基因进行ceRNA网络分析。

文献2:HSP90/AXL/eIF4E-regulated unfolded proteinresponse as an acquired vulnerability in drug-resistant KRAS-mutant lung cancer(于2019年8月发表在影响因子5.995

4.png

HSP90/AXL/eIF4E调控的未折叠蛋白反应作为KRAS突变的耐药性肺癌的突破口

作者使用GSEA对KRAS突变的癌症细胞系的基因表达数据进行了分析,分析了关键EMT信号通路的基因富集情况。