代谢组学是内源性和外源性因素(如遗传变异、疾病发作、药物干预、环境变化等)影响下,生物内源性小分子代谢物(一般分子量< 1000)类型和数量变化的动态规律及其与生理病理变化关系的定量研究。
药物代谢组学通过比较个体给药前后的代谢表型和药物反应表型来评估和预测药物疗效或毒性。
完整的药物代谢组学研究过程包括生物样品采集、生物样品制备、数据采集、数据处理和分析等步骤。
图1所示。药物代谢组学过程概述(Kimet al。, 2014)。
药物代谢组学的研究对象按来源可分为动物样本(尿液、血清、血浆、组织、器官、唾液、肺泡冲洗、脑脊液等)和人体样本(尿液、血清、血浆、唾液、眼泪、毛发等)。
一般来说,液体生物样本(尿液、血液样本、唾液)以毫升为单位收集。固体生物样本(组织、器官)以毫克水平采集。细胞培养样品按1 × 10的水平采集6到1 × 107在细胞数量方面。为保证样本的代表性,减少生物样本的个体差异对结果的影响,应收集足够数量的样本,并注意组间性别、体重、年龄、种族、饮食习惯、采集时间、采样地点的匹配。
生物样品预处理和制备的目的是从复杂的生物基质中提取待测物质,去除干扰杂质,转化为适合测定的物质形式,以提高灵敏度和选择性。
最大限度地保留和表达代谢物信息,减少干扰信息(降解、干扰物质的引入)是选择生物样品制备方法的核心原则。根据实验目的、生物样品类型和数据采集所用的分析仪器,选择合适的样品提取和制备步骤是必要的。
核磁共振(NMR):核磁共振具有预处理简单、快速、无损的优点,但也存在灵敏度低、检测动态范围有限的缺陷。
色谱-质谱技术具有高效、快速、灵敏度高、分离模式多样、结果易解释(变量与代谢物直接相关)等特点。然而,GC/MS和LC/MS都有各自的缺点。GC/MS代谢组学研究中的多峰多源现象影响了代谢途径的后期解释。LC/MS分析的主要问题是共通量峰之间的离子抑制/诱导和基质效应。
代谢组学数据处理和分析技术一般包括数据预处理、模式识别和模型评价、生物标志物筛选和鉴定、代谢途径分析和生物学意义解释。
数据预处理的主要目的是将原始光谱转化为数据矩阵,同时消除或最小化实验和分析过程引入的误差,保留大部分与分类相关的信息。
对原始光谱进行数据预处理后,将得到一个复杂的多维数据集,即代谢物剖面的定量表示。如果我们想要将其与时间、病理生理过程和各种扰动联系起来,我们需要使用多元统计分析对高维复杂数据进行简化和降尺度,并借助可视化的数学模型在低维空间中对样本分组进行整体总结和归纳。
模式识别是代谢组学研究中最常用的多元分析方法之一,主要包括有监督分类和无监督分类。它们之间的本质区别在于每个实验样本所属的类别是否事先已知。一般来说,监督分类需要大量已知类别的样本,常用的方法有偏最小二乘判别分析(PLS-DA)、正交偏最小二乘判别分析(OPLS-DA)、人工神经网络、SIMCA分类等。无监督分类不依赖于样本的类别。无监督分类方法不依赖于训练集,也就是说,它们不需要具有已知类关系的样本作为指导,而是直接在特征空间中寻找点簇或其他可识别的数据结构。主成分分析(PCA)和聚类分析是代谢组学研究中常用的无监督分类方法。
代谢组学研究的一个重要目标是从海量数据中筛选出差异变量,即潜在的生物标志物,并深入探讨其生化意义,指导相关生理病理机制的阐明。为了提高筛选差异变量的准确性和可信度,通常使用多变量统计分析和单变量统计分析相结合的策略,使用多种指标筛选和验证生物标志物。
为了找到这些差异代谢物的生物学意义,所涉及的代谢途径以及与之相关的代谢物、酶、基因等还需要进一步研究。基于web的代谢组学综合软件Metaboanalyst的代谢通路分析功能模块,提供基于代谢网络富集分析的目标代谢通路,以及基于代谢网络得分-log(p)和影响评分大小的网络拓扑分析。
代谢组学与基因组学、蛋白质组学和其他相互作用的整合是当前的趋势,分析结果有望从生物网络和蛋白质-基因代谢物关联的角度对生物机制的解释做出贡献。以及蛋白质-基因-代谢物的关联,以阐明相关的生物学机制。该结果将为从生物网络和蛋白质-基因代谢物关联的角度解释生物机制提供基础。组织数据的整合一般需要使用相关数据库,如HMDB、KEGG、Biocyc、Lipidmaps、PathDB、MMP等。组织数据的整合通常是通过支架分析和建模来实现的。
图2所示。药物代谢组学-药物基因组学(Neavinet al。, 2016)
参考文献