← 返回知识库
为什么需要多组学整合?
单一组学(如转录组)只能提供细胞状态的一个侧面。
通过整合基因组(DNA)、转录组(RNA)、表观组(甲基化/染色质开放性)、蛋白组和代谢组数据,
我们可以构建细胞的"全息图",更全面地理解疾病机制。
整合策略
1. 早期融合 (Early Fusion)
将不同组学的特征直接拼接,输入模型。适用于样本量完全匹配的情况。
2. 晚期融合 (Late Fusion)
分别对每个组学训练模型,最后综合各模型的预测结果。灵活性高,但忽略了组学间的交互。
3. 中期融合 (Intermediate Fusion) - AI的主战场
利用深度学习学习各组学的共同潜在表示(Joint Latent Representation)。
代表模型:MOFA+ (Multi-Omics Factor Analysis)
MOFA使用贝叶斯因子分析,将多组学数据分解为一组潜在因子(Factors)。
每个因子代表一种生物学驱动力(如细胞周期、炎症、技术噪音),并量化其对各组学的贡献。
单细胞多组学整合 (scMulti-omics)
随着CITE-seq(RNA+蛋白)和Multiome(RNA+ATAC)技术的普及,单细胞多组学整合成为热点。
- Seurat v4 (WNN): 加权最近邻图,根据每个细胞在不同模态上的信息含量动态调整权重。
- TotalVI: 基于VAE的概率模型,同时处理RNA和蛋白数据,处理缺失值和批次效应。
- GLUE: 基于图神经网络,利用先验调控知识(如ATAC峰与基因的位置关系)整合非配对的多组学数据。
应用场景
- 精准肿瘤学:结合基因突变、表达谱和免疫微环境特征,预测免疫治疗响应。
- 生物标志物发现:识别跨组学的一致性特征,提高标志物的鲁棒性。
© 2025 知识库 | 返回首页