基于蛋白质语言模型的B细胞表位预测方法、装置、设备及计算机程序产品
本申请公开了一种基于蛋白质语言模型的B细胞表位预测方法、装置、设备及计算机程序产品,方法包括:将待预测的蛋白质序列分别输入预训练的ESM-IF1模型和预训练的ESM2模型,以捕获多维度的结构嵌入向量和序列特征向量后,进行拼接;基于Transformer架构,通过集成卷积神经网络对多维度数据集进行训练,并计算TIM损失函数;利用深度卷积神经网络模型输出蛋白质序列的每个氨基酸位置的预测概率;如果预测概率大于设定阈值,则判定对应的氨基酸位置为表位,否则为非表位。本申请通过有效整合蛋白质语言模型输出的向量,卷积神经网络与Transformer的有机融合,实现对B细胞表位非线性特征的深度挖掘和高效学习,...
Saved in:
Format | Patent |
---|---|
Language | Chinese |
Published |
04.07.2025
|
Subjects | |
Online Access | Get full text |
Cover
Summary: | 本申请公开了一种基于蛋白质语言模型的B细胞表位预测方法、装置、设备及计算机程序产品,方法包括:将待预测的蛋白质序列分别输入预训练的ESM-IF1模型和预训练的ESM2模型,以捕获多维度的结构嵌入向量和序列特征向量后,进行拼接;基于Transformer架构,通过集成卷积神经网络对多维度数据集进行训练,并计算TIM损失函数;利用深度卷积神经网络模型输出蛋白质序列的每个氨基酸位置的预测概率;如果预测概率大于设定阈值,则判定对应的氨基酸位置为表位,否则为非表位。本申请通过有效整合蛋白质语言模型输出的向量,卷积神经网络与Transformer的有机融合,实现对B细胞表位非线性特征的深度挖掘和高效学习,具有预测准确性高、泛化能力强以及鲁棒性良好的优势。 |
---|---|
Bibliography: | Application Number: CN202510717656 |