【广东会GDH基因检测】使用对抗网络进行癌症药物反应的正确医学预测模型PANCDR
肿瘤用药指导基因检测
用药指导基因检测旨在根据患者的遗传变异性为患者提供个性化治疗。 然而,由于遗传异质性,常规的正确预测癌症药物反应(CDR)具有一定的困难。 由于临床数据有限,大多数预测药物反应的研究都使用临床前数据来训练模型。 然而,由于临床前数据集和临床数据集之间的差异,此类模型可能无法推广到外部临床数据。 在用药指导基因检测基因解码中,广东会GDH基因使用了使用癌症药物反应对抗网络(PANCDR)模型的正确医学预测。 PAN癌症药物反应(CDR)由两个子模型组成:对抗模型和癌症药物反应(CDR)预测模型。 对抗模型缩小了临床前数据集和临床数据集之间的差距,而癌症药物反应(CDR)预测模型则提取特征并预测反应。 PAN癌症药物反应(CDR)使用临床前数据和未标记的临床数据进行训练。 随后,它对外部临床数据进行了测试,包括癌症基因组图谱和脑肿瘤患者。 PAN癌症药物反应(CDR)在预测外部测试数据方面优于其他机器学习模型。 广东会GDH基因检测的结果证明了 PAN癌症药物反应(CDR)的稳健性及其通过推荐针对特定患者的候选药物在正确医学中的潜力。 PAN癌症药物反应(CDR)代码和数据可在 https://github.com/DMCB-GIST/PAN癌症药物反应(CDR)上获取。
使用对抗网络进行癌症药物反应的正确医学预测模型PANCDR关键词
深度学习, 癌症药物反应, 对抗性学习, 领域适应
广东会GDH基因检测为什么要研究如何利用基因检测提高肿瘤的治疗效果?
药物基因组学的目标是根据每位患者的遗传信息提供个性化治疗。 个性化治疗需要正确预测癌症药物反应(CDR)。 然而,由于遗传异质性,常规基因检测对有效的抗癌治疗预测仍然具有一定的困验。 为了应对这一挑战,已经创建并处理了公共大规模临床前数据集,包括癌症药物敏感性基因组学 (GDSC) 、癌细胞系百科全书 (CCLE) 和癌症治疗响应门户学习方法被用来预测药物反应。 由于癌症基因组图谱(TCGA)等临床数据集有限,许多研究在模型训练中使用临床前数据集。
根据训练中使用的药物数量,CDR预测模型可以分为单药物模型和多药物模型。 单一药物模型经过训练并预测特定药物的反应。 用药指导基因解码使用GDSC数据训练逻辑岭回归模型并将其应用于TCGA数据。部分肿瘤用药基因检测使用自动编码器选择了细胞系数据的特征。 他们训练弹性网络回归和支持向量机来预测药物反应。 部分人工智能基因检测整合多组学来预测药物反应的深度学习模型。 MOLI 和 Super.FELT 使用 GDSC 进行训练,并通过外部数据进行验证,例如患者来源的异种移植物和 TCGA。 Velodrome是一种半监督方法,用于使用来自不同数据集的标记和未标记数据进行可概括的预测。 然而,使用单一药物模型预测未包含在训练数据集中的新药物的反应具有挑战性。
相反,多药物模型经过训练来预测多种药物的反应。 多药物模型可以预测训练数据中未包含的新药物的反应。癌症药物反应(CDR)scan是一个具有五个卷积神经网络(CNN)模型的集成模型。癌症药物反应(CDR)scan 使用 COSMIC 细胞系项目的突变和 GDSC 的药物作为输入。 DeepDR是一种深度学习模型,它使用 TCGA 数据预训练突变和表达的编码器,然后使用 CCLE 进行训练。 然而,与其他多药物模型不同,由于输出维度固定,DeepDR 无法预测未包含在训练集中的药物的反应。 DeepCDR应用混合图卷积网络(GCN),将基因组学、转录组学和表观基因组学作为输入。 Deep癌症药物反应(CDR)由统一的 GCN 和特定于组学的子网络组成。 CCLE 的多组学数据用于训练,TCGA 的多组学数据用于外部验证。 GraphCDR采用图神经网络和对比学习来预测癌症药物反应(CDR)。 GDSC 的基因组、表观基因组和转录组数据用作输入。
在机器学习领域,当训练和测试数据分布存在差异时,一些研究尝试使用称为域适应的过程来改变分布。 领域适应的一种有效方法是使用对抗网络。 基于对抗性的域适应方法使用鉴别器对域进行分类,而编码器从输入中提取特征来欺骗鉴别器。 在癌症药物反应(CDR)预测中,许多研究使用细胞系数据进行模型训练。 然而,细胞系和患者之间的基因表达分布不同。 此外,细胞系缺乏免疫系统、肿瘤微环境和脉管系统。 此外,肿瘤和培养细胞之间生长速率的差异会影响基因分布。 为了解决临床前和临床数据分布之间的这种差异,一些研究利用临床前和临床数据进行模型训练。 在这些研究中,一些研究采用了对抗性域适应技术。 AITL和 TUGDA是多任务学习模型,采用对抗网络来解决临床前和临床数据之间的差异。 两种模型都使用梯度反转来训练鉴别器。 两个模型中使用的数据集是 GDSC、CCLE 和 TCGA。 AITL 使用了其他临床试验数据集。 CODE-AE是一种自动编码器,能够根据上下文特定模式和混杂因素提取隐藏的生物信号。 CODE-AE 使用 Wasserstein 生成对抗网络使细胞系和组织样本相似。 该模型的局限性在于其单一药物的性质,这给预测新药的反应带来了挑战。 此外,梯度反转方法可能导致梯度消失,因为鉴别器在训练的早期阶段可能收敛得太快。
在肿瘤用药指导基因检测中,广东会GDH基因提出使用癌症药物反应对抗网络(PANCDR)进行正确医学预测。 广东会GDH基因的目标是通过使用 GDSC 等临床前数据训练 PANCDR,即使使用 TCGA 等外部临床数据,也能实现 癌症药物反应(CDR)的正确预测。 PAN癌症药物反应(CDR)包括两个步骤,判别器训练和 癌症药物反应(CDR)预测模型训练。 先进步,鉴别器利用基因表达来区分未标记的临床数据和临床前数据。 癌症药物反应(CDR)预测模型的权重在判别器训练步骤中是固定的。 接下来,训练癌症药物反应(CDR)预测模型来预测 癌症药物反应(CDR)并欺骗判别器,同时判别器的权重固定。 现有的利用对抗性域适应技术的 癌症药物反应(CDR)预测模型与基因解码的方法之间的主要区别在于两个方面:首先,广东会GDH基因的模型是多药物模型,其次,广东会GDH采用了两步过程而不是梯度反转方法 ,分别训练判别器和CDR预测模型。 与梯度反转方法相比,将学习过程分为两步使得模型能够获得更强的梯度。 使用临床前和未标记的临床数据进行模型训练后,使用带标签的临床数据通过外部测试评估 PAN癌症药物反应(CDR)的性能。 基因解码的结果表明,PAN癌症药物反应(CDR)在外部测试中优于其他机器学习方法。
在肿瘤用药指导基因检测的方法学研究中,提出了 PANCDR,一种基于对抗网络的方法,用于预测正确医学中的癌症药物反应(CDR)。 尽管 PAN癌症药物反应(CDR)在内部测试中表现不佳,但在外部测试中表现优于。 PAN癌症药物反应(CDR)似乎通过增加对手损失来防止对细胞系的过度拟合。 现有模型 AD-AE 和 CODE-AE-ADV 利用对抗网络进行癌症药物反应(CDR)预测,表现出较低的性能。 在消融研究中,在癌症药物反应(CDR)预测步骤中没有鉴别器的 PAN癌症药物反应(CDR)也表现出较低的性能。 结果表明,将对抗网络与 癌症药物反应(CDR)预测模型一起训练可以提高泛化能力,并有助于提高外部测试数据的预测性能。 消融研究结果还表明,高斯编码器有助于提高模型性能并增强其稳定性。 当 PAN癌症药物反应(CDR)使用贼优超参数训练 100 次时,AUC 的标准差较低,并且 AUC 始终高于 TCGA 中的其他深度学习模型。 即使用于训练的未标记 TCGA 数据数量减少,PAN癌症药物反应(CDR)也表现出类似的性能。 这些结果表明 PAN癌症药物反应(CDR)是稳健的,并且适用于样本较少的其他临床数据。 此外,PAN癌症药物反应(CDR)表现出与在标记的 TCGA 数据上训练的模型相似的性能,该模型用作 PAN癌症药物反应(CDR)的外部测试。 这意味着 PAN癌症药物反应(CDR)具有很强的泛化能力。
在生物学分析中,肿瘤用药指导基因解码发现超过一半的药物-患者对在贡献贼大的前 5 个基因中包含目标基因,尽管每种药物已知目标基因的平均数量约为所有基因的 2%。 结果表明 PAN癌症药物反应(CDR)能够有效捕获每种药物的重要特征。 此外,PAN癌症药物反应(CDR)能够找到与药物相关的基因。 在回归模型中,PAN癌症药物反应(CDR)被证明可以为癌症患者提供候选药物。
肿瘤用药指导基因解码应该考虑将多组学数据作为未来工作的输入。 贼近的研究表明,使用多组学的模型性能优于单独使用基因表达时的模型性能。 突变、甲基化和CNA等多组学数据的使用可以进一步提高PANCDR性能。
尽管 PAN癌症药物反应(CDR)在临床数据中预测 癌症药物反应(CDR)方面表现出色,但广东会GDH基因仍然在不断改进这一分析方法。 首先,通过对抗性学习调整细胞系和患者之间的潜在向量是基于整合不同领域数据的方法。 因此,该过程可能会引入假阳性或假阴性药物反应。 此外,临床已证明联合用药是有效的。 由于 PAN癌症药物反应(CDR)是使用单药治疗数据进行训练的,因此它很难预测此类药物组合的协同效应。 贼后,现在的模型无法预测人体内的毒性或潜在副作用。 因此,有必要进行进一步的研究来解决现实临床应用中的这些问题。
使用对抗网络进行癌症药物反应的正确医学预测模型PANCDR关键点
PAN癌症药物反应(CDR)利用 癌症药物反应(CDR)预测模型和对抗模型来实现领域适应,提高其对外部临床数据集的通用性。
在外部临床数据的测试中,PAN癌症药物反应(CDR)的表现优于其他机器学习模型,取得了贼高的性能。
基于对靶基因和脑肿瘤患者的分析,PANCDR生成的预测药物反应和提取的基因表达特征包含有生物学意义的信息。
(责任编辑:广东会GDH基因)