Skip to main content

Access Agilent 期刊 - 2016 年 9 月

多组学分析可帮助研究人员在癌症研究中整合复杂的组学数据

Shweta Shukradas
安捷伦生物信息学产品经理

Carolina Livi
安捷伦学术部门经理,
疾病研究和毒理学

如今,科学家们常常使用多组学技术来更好地了解所研究的生物学问题。因此,分析基因组学、转录组学、蛋白质组学和代谢组学实验中生成的不断增加的复杂数据集面临着巨大挑战。可分析多组学数据的整合方法能显著减少困难,并提供单独实验中通常会遗漏的重要信息。最近,研究报道已证实使用安捷伦 GeneSpring 整合生物学软件(包括 Mass Profiler Professional 和 Pathway Architect)可成功整合多组学数据集。本文重点讨论了所选实例中的一些主要研究成果。

图 1. SRL 处理 4 小时后的 MAPK 信号通路。黄色框表示转录差异表达。每个基因旁边的热点带显示了每个时间点的基因表达水平。

通过人工注释的通路分析了解 mRNA-miRNA 的关系

为了了解转录的生物学结果,评估信使 RNA (mRNA) 和非编码 RNA(例如 microRNA (miRNA))的表达十分重要。本文采用通路和相关分析,在转录水平研究了真菌齐整小核菌的一种凝集素 SRL 对肠癌细胞系 (HT29) 的凋亡效应 [1]。

SLR 处理后的早期,有丝分裂原激活的蛋白激酶 (MAPK) 基因表现出显著的差异调节(图 1)。其他在处理后早期表现出差异调节的基因还有 MAP3K14 和 DUSP1,均为上调。以及 MAP3K4 和 ATF2,在 SRL 处理之后两小时发生下调。结果表明 SRL 诱导的凋亡是由 MAP 激酶通路中的磷酸酶和激酶相互影响引发的。

图 2. A) 相关性分析展示了四小时时,差异表达 MAPK mRNA 和差异表达 miRNA 之间的相关性。B) 散点图展示了 JUN 和 hsa-miR-487b 之间的关系

图 3. 基于 54 种蛋白质分离对照 (E) 和肿瘤 (T) 样品,这些蛋白质是通过安捷伦  GeneSpring 在TCGA mRNA 表达实验中根据基因信号的翻译鉴定所得的。A) 样品间的相关性;B) PCA

相关性分析显示了基因表达对 miRNA 的依赖性

miRNA 的功能性作用通常会导致靶标 mRNA 水平和所得蛋白质的含量减少。因此,研究人员可以鉴定出 miRNA 水平和推断的 mRNA 靶基因之间的反相关性。这在差异表达分析和基于序列的 miRNA 靶标预测(均可通过 GeneSpring 平台完成)之外,提供了一个额外的筛选维度。

采用相关性分析工具,对经 SRL 处理和未处理的 HT 29 细胞随时间变化的基因表达数据集(包括 mRNA 和 miRNA)进行多组学分析 (MOA),数据由安捷伦微阵列芯片采集。安捷伦 GeneSpring/MPP 可帮助研究人员就两种不同技术(包括 mRNA/miRNA 配对)的实验中获取的基因结果进行相关分析。图 2A 展示了 SRL 处理四小时后,差异表达 miRNA 和差异表达 MAPK 基因间的相关性热图。相关系数散点图如图 2B 中所示,展示了 JUN 和 hsa-miR-487b 的表达依赖性。该相关性说明 JUN 可能是 miR-487b miRNA 的靶标。

多形性成胶质细胞瘤 (GBM) 中的基因和蛋白核心信号的鉴定

GeneSpring 可以对不同组学测量结果进行分析,例如,基因表达和蛋白质组学数据集。GBM 是脑肿瘤,在使用基因谱分析之前很难对其进行分类。本研究整合了从癌症和肿瘤基因图谱 (TCGA) 获取的已公开发表的芯片基因表达数据。将该基因表达数据导入安捷伦 GeneSpring,可获得基因签名以指导 GBM 样品的小蛋白质组学分析。在 GeneSpring/MPP 相关性框架中比较基因组学和蛋白质组学数据集,可鉴定出由 54 个基因和蛋白质构成的核心签名(图 3)[2]。结果表明,核心签名的分类能力与 840 个基因和 587 个蛋白质的分类能力相当,表明安捷伦 GeneSpring 具有强大的多组学数据分析能力。结果指出 GBM 肿瘤的异质性可由签名基因的 mRNA 和蛋白丰度实现最佳表征。这些结果为将来整合方法的使用奠定了坚实的基础。

图 4. A) 细胞循环通路分裂期,维基通路网站的 WP190_81191 展示了小鼠细胞系自发二倍化研究中的畸变和表达水平。B) 图例解释了阅读通路中叠加数据所需的不同颜色设置。表达实验所得数据以青色条状拼接图表示,CGH 实验所得数据以深黄色条状拼接图表示。C) A. Gene Tbc1d8 中通路的放大图说明两次二倍性重复实验中均未发生畸变,且为中等表达;单倍体态的第一次重复实验表现为低表达和一个缺失突变,而单倍体态的第二次重复实验中表现为高表达(以深红色表示),尽管有一个基因的拷贝缺失

GeneSpring 的数据整合能力扩展至拷贝数数据

安捷伦 GeneSpring GX 中的比较基因组杂交 (CGH) 工作流程可帮助科学家整合分析 CGH 数据及基因表达数据。该工作流程的设计可读取安捷伦 Cytogenomics 软件或安捷伦基因组学工作台 (AGW) 报告中的平均 CGH Log 比值(平均 CGHLR)和杂合性缺失 (LOH) 得分。该工作流程还有助于进行数据可视化、生物情境化,以及多组学分析。为了证实其功能,将 NCBI 基因表达数据库 (GEO) 中的 CGH 和小鼠基因表达微阵列芯片数据集导入 GeneSpring GX 进行整合分析。本文介绍了 Wee1 抑制剂 (PD166285) 对源自 C57BL/6 或 BDF1 F1 杂合小鼠的单倍单性生殖 ES 细胞 (phESC) 的影响,以及与小鼠胚胎干细胞 (mESC) 的比较 [3]。在安捷伦 GeneSpring GX 中采用注释富集实验可轻松整合拷贝数畸变信息和表达谱分析。这些数据可由数据整合方法轻松整合,例如人工注释的通路和源自文献的网络。通路中重叠的数据可实现复杂变化的综合可视化,以热图、热条带和拼接图的形式呈现(请参见图 4 A-C)。

安捷伦 GeneSpring 软件可轻松实现复杂数据集的整合

本文中的三个示例展示了安捷伦 GeneSpring 软件如何利用相关性工具,以及专业的通路可视化帮助实验室科学家为传统生物信息学分析补充更多信息。这些工具有助于研究人员更直观、更简单地鉴定共调控基因、代谢物和蛋白质。如需了解更多信息,请立即联系安捷伦客户服务中心

仅限研究使用。不可用于诊断目的。

参考文献

  1. Gene Expression and miRNA Study to Understand Signaling Pathways Inducing Apoptosis in Human Colon Cancer HT29 Cells(通过基因表达和 miRNA 研究了解人类结肠癌 HT 29 细胞中诱导细胞凋亡的信号通路),安捷伦科技公司,应用简报,出版号 5991-6377EN,(2016)
  2. Molecular Subtypes in Glioblastoma Multiforme: Integrated Analysis Using Agilent GeneSpring and Mass Profiler Professional Multi-Omics Software(多形性成胶质细胞瘤的分子亚型:利用安捷伦 GeneSpring 和 Mass Profiler Professional 多组学软件进行整合分析),安捷伦科技公司,应用简报,出版号 5991-5505EN,(2016)
  3. Working with CGH data in Agilent GeneSpring GX(利用安捷伦 GeneSpring GX 分析 CGH 数据),安捷伦科技有限公司,技术概览,出版号 5991-7289EN (2016)

Figure 1

SRL 处理 4 小时后的 MAPK 信号通路。黄色框表示转录差异表达。每个基因旁边的热点带显示了每个时间点的基因表达水平。

图 2

A) 相关分析展示了四小时时,差异表达 MAPK mRNA 和差异表达 miRNA 之间的相关性。B) 散点图展示了 JUN 和 hsa-miR-487b 之间的关系。

图 3

基于 54 种蛋白质分离对照 (E) 和肿瘤 (T) 样品,这些蛋白质是通过安捷伦nbsp GeneSpring 在TCGA mRNA 表达实验中根据基因信号的翻译鉴定所得的。A) 样品间的相关性;B) PCA。

图 4

A) 细胞循环通路分裂期,维基通路网站的 WP190_81191 展示了小鼠细胞系自发二倍化研究中的畸变和表达水平。B) 图例解释了阅读通路中叠加数据所需的不同颜色设置。表达实验所得数据以青色条状拼接图表示,CGH 实验所得数据以深黄色条状拼接图表示。C) A. Gene Tbc1d8 中通路的放大图说明两次二倍性重复实验中均未发生畸变,且为中等表达;单倍体态的第一次重复实验表现为低表达和一个缺失突变,而单倍体态的第二次重复实验中表现为高表达(以深红色表示),尽管有一个基因的拷贝缺失。