John McLean 博士
大数据生物学安捷伦帮助研究人员快速获取大量详细信息John McLean 博士从事生物学范式转移的相关研究。 他将其称之为大数据生物学。 McLean 博士和他在范德堡大学的团队使用 Agilent 6560 离子淌度 Q-TOF 液质联用系统进行非靶向实验,每分钟可以收集 50000 个分子的详细信息。 有关蛋白质、脂质、糖类和多肽的详细信息全都包括在内。 McLean 将他的团队创建的方法形容为整合组学,并视之为实现其研究目标的唯一途径。 他们希望能够揭示各生物组分相互作用的隐藏模式 — 例如,那些能揭示细菌(如在范德堡大学所在州田纳西州的洞穴内发现的细菌)体内有前景的新型候选药物合成的模式。 “我们打破了原来单组学研究的陈规,例如基因组学、蛋白质组学等,转而利用离子淌度与质谱联用,开展完全非靶向、无偏向性的分子研究,”McLean 说道。
Agilent 6560 离子淌度系统所采用的技术使科学家们能够非常迅速地获取大量详细信息。
“现在,无论我们是否有预期靶标,都能够开展针对某个生物学问题的研究,”McLean 说,“分析结果能够为我们指出需要关注的地方。” 从海量数据中找出有价值的内容,确实是个很大的挑战。但这正是 McLean 和他的团队所擅长的。 像亚马逊和 Netflix 这样的公司会通过技术手段筛查数百万用户的累积操作并据此推荐用户可能感兴趣的书籍和电影,McLean 和他的团队也使用同类技术:他们利用计算机集群筛查数据,并从中找出有价值的关联。 McLean 将这一过程比作您小时候可能玩过的滑块拼图。 “道理是一样的,”他说,“Agilent 6560 每分钟为我们提供 50000 份详细的分子信息,我们首先得像玩滑块拼图一样将它们分类并聚集到一起,组合成完整的图形,然后才去解读这些信息。这 50000 份分子信息中,可能有很多都是干扰信息 — 例如只是一些生物学背景信息。我们想要了解的是:有哪些关联性源自直接受药物或其他刺激影响的分子?然后我们再花时间去确定它们的具体信息。” 这些关联性就是一块块拼图,然后有趣的游戏就开始了。 “所有的大数据分析都是这样运作的,”McLean 说,“模式是什么?一旦脱离数据描述词,大数据本身只是数量庞大的数字而已。其价值取决于研究这些数字并了解其来源的人。这与你从事互联网商务还是想要解决生物学问题没有关系。它们其实是一回事。”
McLean 在范德堡大学负责很多研究项目,研究领域涉及疾病诊断、药物发现,以及寻找能在出现症状之前指示疾病的生物标记物。
其中一个卓有成效的例子是团队称之为“细菌搏击俱乐部”的项目。 这要从 McLean 的一个合作伙伴说起,他是一名洞穴勘探爱好者,同时也是酶学家。 “田纳西州和肯塔基州有上万个洞穴,他从中采集到了许多人类此前尚未发现的细菌,”McLean 解释道,“在对它们进行基因分析时,我们发现某些基因簇能编码类似药物的分子 — 一些此前尚未发现的天然攻击性和防御性生物制剂。但是,要弄清如何才能让细菌合成这些物质难度极大,于是我们创造了这种叫做“细菌搏击俱乐部”的方法。我们首先对新发现的菌种进行单独培养,然后培养已熟知的细菌 — 例如大肠杆菌,最后将它们共同培养。此时两种菌必须相互竞争有限的营养源。这时,新细菌会突然打开一般情况下难以唤醒的这些基因。我们已经采用这种方法分离出了多种全新的药物分子。” “下面可以开始研究算法了。如果已经掌握了细胞培养的拼图,那么就可以将来自单独培养的这部分信息扣除。现在剩下的就只是那些微生物在竞争资源时产生的新分子,”McLean 说道。 “一般来说药物都是不同类型分子的混合体,因此你的分析对象永远不可能仅仅只是脂质、糖类或多肽中的某一种。你所研究的是由上述不同类型物质组成的优质药物分子。因此,整合组学至关重要。这也是唯一的研究途径。” 仅限研究使用。不可用于诊断目的。
|
John A. McLean 博士
|