基于Convolutional-LSTM的蛋白质亚细胞定位研究

TP391; 蛋白质亚细胞位置预测研究是目前蛋白质组学和生物信息学研究的重点问题之一.蛋白质的亚细胞定位决定了它的生物学功能,故研究亚细胞定位对了解蛋白质功能非常重要.由于蛋白质结构的序列性,考虑使用序列模型来进行亚细胞定位研究.尝试使用卷积神经网络(convolutional neural network,CNN)、长短期记忆神经网络(long short-term memory,LSTM)两种模型挖掘氨基酸序列所包含的信息,从而进行亚细胞定位的预测.随后构建了基于卷积的长短期记忆网络(Convolutional-LSTM)的集成模型进行亚细胞定位.首先通过卷积神经网络对蛋白质数据进行特征抽...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 13; no. 6; pp. 982 - 989
Main Authors 王春宇, 徐珊珊, 郭茂祖, 车凯, 刘晓燕
Format Journal Article
LanguageChinese
Published 哈尔滨工业大学 计算机科学与技术学院,哈尔滨,150001%哈尔滨工业大学 计算机科学与技术学院,哈尔滨 150001 01.06.2019
北京建筑大学 电气与信息工程学院,北京 100044
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.1806028

Cover

More Information
Summary:TP391; 蛋白质亚细胞位置预测研究是目前蛋白质组学和生物信息学研究的重点问题之一.蛋白质的亚细胞定位决定了它的生物学功能,故研究亚细胞定位对了解蛋白质功能非常重要.由于蛋白质结构的序列性,考虑使用序列模型来进行亚细胞定位研究.尝试使用卷积神经网络(convolutional neural network,CNN)、长短期记忆神经网络(long short-term memory,LSTM)两种模型挖掘氨基酸序列所包含的信息,从而进行亚细胞定位的预测.随后构建了基于卷积的长短期记忆网络(Convolutional-LSTM)的集成模型进行亚细胞定位.首先通过卷积神经网络对蛋白质数据进行特征抽取,随后进行特征组合,并将其送入长短期记忆神经网络进行特征表征学习,得到亚细胞定位结果.使用该模型能达到0.816 5的分类准确率,比传统方法有明显提升.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.1806028