系列二分決定グラフを用いたタンパク質配列モチーフの多重表現

本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB...

Full description

Saved in:
Bibliographic Details
Published inJournal of Computer Chemistry, Japan Vol. 19; no. 1; pp. 8 - 17
Main Authors 桂樹, 哲雄, 大和, 康平, 加藤, 博明, 高橋, 由雅
Format Journal Article
LanguageJapanese
Published 日本コンピュータ化学会 2020
Subjects
Online AccessGet full text

Cover

Loading…
Abstract 本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB/Swiss-Prot (Rel. 2017_09)から得られた555,594の全てのアミノ酸配列に対して検索した.PROSITEパターンを使用した同様の検索結果と比較して,本手法は,適合率,再現率,およびF値において良好な結果を示した.
AbstractList 本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB/Swiss-Prot (Rel. 2017_09)から得られた555,594の全てのアミノ酸配列に対して検索した.PROSITEパターンを使用した同様の検索結果と比較して,本手法は,適合率,再現率,およびF値において良好な結果を示した.
Author 加藤, 博明
大和, 康平
桂樹, 哲雄
高橋, 由雅
Author_xml – sequence: 1
  fullname: 桂樹, 哲雄
  organization: 豊橋技術科学大学 情報・知能工学系 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1
– sequence: 1
  fullname: 大和, 康平
  organization: 豊橋技術科学大学 情報・知能工学系 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1
– sequence: 1
  fullname: 加藤, 博明
  organization: 広島商船高等専門学校 流通情報工学科 〒725-0231 広島県豊田郡大崎上島町東野4272-1
– sequence: 1
  fullname: 高橋, 由雅
  organization: 豊橋技術科学大学 情報・知能工学系 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1
BookMark eNo9kMtKw0AUhgepYK3d-hapc0kyyVLqFQpuCi6HmXSiDbVK0o3LZLx0YRFFEboRxUV1UZXuqujDjLHtW2iwuPnPD-c7Z_HNg1xzvykBWESwhE1KlwLPC0oYIteAEDszII-ISQ3iYDM37YjadA4Uo6guIITUgshy82B7NHhL2zdfw7O0ffL9Okz7XZ28aPWo1bVOLkdXPR0f6fhWJ59aDbS60MnzePA0Oe78Xml1r1Ws1XsGx_30oTs57YzveqPzjwUw6_NGJIvTWQDVtdVqecOobK1vlpcrRoCxAw1kSUE5ptQUwuKECOFL6toeksJ0bB_6FLo1gmzJuWX9csTh0pQ-xFhSUeOkAFb-3gZRi-9IdhDW93h4yHjYqnsNyTItDLkMZZHpYZme_7W3y0MWcPIDD9h-6g
ContentType Journal Article
Copyright 2020 日本コンピュータ化学会
Copyright_xml – notice: 2020 日本コンピュータ化学会
DOI 10.2477/jccj.2019-0028
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Chemistry
EISSN 1347-3824
EndPage 17
ExternalDocumentID article_jccj_19_1_19_2019_0028_article_char_ja
GrantInformation 栢森情報科学振興財団
GroupedDBID 29K
2WC
ACIWK
ALMA_UNASSIGNED_HOLDINGS
D-I
E3Z
EBS
EJD
GX1
HH5
JSF
JSH
KQ8
OK1
OVT
PQQKQ
RJT
RNS
RZJ
TKC
XSB
ID FETCH-LOGICAL-j2280-15eb7a2774bb5a33bbfe796c1eb486f0f709d316eaa55a2738ae4ef022e7bda3
ISSN 1347-1767
IngestDate Wed Sep 03 06:08:55 EDT 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed false
IsScholarly true
Issue 1
Language Japanese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-j2280-15eb7a2774bb5a33bbfe796c1eb486f0f709d316eaa55a2738ae4ef022e7bda3
OpenAccessLink https://www.jstage.jst.go.jp/article/jccj/19/1/19_2019-0028/_article/-char/ja
PageCount 10
ParticipantIDs jstage_primary_article_jccj_19_1_19_2019_0028_article_char_ja
PublicationCentury 2000
PublicationDate 2020
PublicationDateYYYYMMDD 2020-01-01
PublicationDate_xml – year: 2020
  text: 2020
PublicationDecade 2020
PublicationTitle Journal of Computer Chemistry, Japan
PublicationYear 2020
Publisher 日本コンピュータ化学会
Publisher_xml – name: 日本コンピュータ化学会
References [1] D. W. Mount, Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory (2004)
[7] R. D. Finn, P. Coggill, R. Y. Eberhardt, S. R. Eddy, J. Mistry, A. L. Mitchell, S. C. Potter, M. Punta, M. Qureshi, A. Sangrador-Vegas, G. A. Salazar, J. Tate, A. Bateman, Nucleic Acids Res., 44, D1, D279 (2016). doi:10.1093/nar/gkv1344 PMID:26673716
[10] M. Itoh, J. C. Nacher, K. Kuma, S. Goto, M. Kanehisa, Genome Biol., 8, R121 (2007). doi:10.1186/gb-2007-8-6-r121 PMID:17588271
[3] B. Kobe, A. V. Kajava, Curr. Opin. Struct. Biol., 11, 725 (2001). doi:10.1016/S0959-440X(01)00266-4 PMID:11751054
[17] A. V. Aho, M. J. Corasick, Commun. ACM, 18, 333 (1975). doi:10.1145/360825.360855
[5] T. Akutsu, Mathematics and Algorithms of Bioinformatics, Kyoritsu Shuppan (2007), in Japanese.
[11] Z. Wang, X. C. Zhang, M. H. Le, D. Xu, G. Stacey, J. Cheng, PLoS One, 6, e17906 (2011). doi:10.1371/journal.pone.0017906 PMID:21455299
[12] E. Loekito, J. Bailey, J. Pei, Knowl. Inf. Syst., 24, 235 (2010). doi:10.1007/s10115-009-0252-9
[15] M. Yoneda, N. Osato, S. Hirose, S. Okawa, Fundamentals of Automaton and Linguistic Theory, Kindai Kagakusha (2003), in Japanese.
[6] C. J. A. Sigrist, E. de Castro, L. Cerutti, B. A. Cuche, N. Hulo, A. Bridge, L. Bougueleret, I. Xenarios, Nucleic Acids Res., 41, D1, D344 (2012). doi:10.1093/nar/gks1067 PMID:23161676
[2] H. Toh, M. Ono, K. Saigo, T. Miyata, Nature, 315, 691 (1985). doi:10.1038/315691a0
[14] ERATO Minato Discrete Structure Manipulation System Project, Super-High-Speed Graph Enumeration Algorithm, Morikita Shuppan (2015), in Japanese.
[16] R. D. L. Briandais, File searching using variable length keys, Proc. Western J. Computer Conf., 295–298 (1959)
[9] H. E. Van Wart, H. Birkedal-Hansen, Proc. Natl. Acad. Sci. USA, 87, 5578 (1990). doi:10.1073/pnas.87.14.5578 PMID:2164689
[13] S. Denzumi, R. Yoshinaka, H. Arimura, S. Minato, Discrete Appl. Math., 212, 61 (2016). doi:10.1016/j.dam.2014.11.022
[18] The UniProt Consortium, Nucleic Acids Res., 45, D1, D158 (2017). doi:10.1093/nar/gkw1099 PMID:27899622
[4] S. Lanouette, J. A. Davey, F. Elisma, Z. Ning, D. Figeys, R. A. Chica, J. F. Couture, Structure, 23, 206 (2015). doi:10.1016/j.str.2014.11.004 PMID:25533488
[8] S. Azuma, H. Kato, Development of the structural feature analysis system based on the motif combination pattern of proteins, Chem-Bio Informatics Society Annual Meeting 2015, P3–7 (2015)
[19] L. J. Bailey, T. J. Cluett, A. Reyes, T. A. Prolla, J. Poulton, C. Leeuwenburgh, I. J. Holt, W. W. Li, W. S. Noble, Nucleic Acids Res., 37, 2327 (2009). doi:10.1093/nar/gkp091 PMID:19458158
References_xml – reference: [1] D. W. Mount, Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory (2004)
– reference: [4] S. Lanouette, J. A. Davey, F. Elisma, Z. Ning, D. Figeys, R. A. Chica, J. F. Couture, Structure, 23, 206 (2015). doi:10.1016/j.str.2014.11.004 PMID:25533488
– reference: [5] T. Akutsu, Mathematics and Algorithms of Bioinformatics, Kyoritsu Shuppan (2007), in Japanese.
– reference: [14] ERATO Minato Discrete Structure Manipulation System Project, Super-High-Speed Graph Enumeration Algorithm, Morikita Shuppan (2015), in Japanese.
– reference: [13] S. Denzumi, R. Yoshinaka, H. Arimura, S. Minato, Discrete Appl. Math., 212, 61 (2016). doi:10.1016/j.dam.2014.11.022
– reference: [2] H. Toh, M. Ono, K. Saigo, T. Miyata, Nature, 315, 691 (1985). doi:10.1038/315691a0
– reference: [12] E. Loekito, J. Bailey, J. Pei, Knowl. Inf. Syst., 24, 235 (2010). doi:10.1007/s10115-009-0252-9
– reference: [17] A. V. Aho, M. J. Corasick, Commun. ACM, 18, 333 (1975). doi:10.1145/360825.360855
– reference: [11] Z. Wang, X. C. Zhang, M. H. Le, D. Xu, G. Stacey, J. Cheng, PLoS One, 6, e17906 (2011). doi:10.1371/journal.pone.0017906 PMID:21455299
– reference: [7] R. D. Finn, P. Coggill, R. Y. Eberhardt, S. R. Eddy, J. Mistry, A. L. Mitchell, S. C. Potter, M. Punta, M. Qureshi, A. Sangrador-Vegas, G. A. Salazar, J. Tate, A. Bateman, Nucleic Acids Res., 44, D1, D279 (2016). doi:10.1093/nar/gkv1344 PMID:26673716
– reference: [8] S. Azuma, H. Kato, Development of the structural feature analysis system based on the motif combination pattern of proteins, Chem-Bio Informatics Society Annual Meeting 2015, P3–7 (2015)
– reference: [9] H. E. Van Wart, H. Birkedal-Hansen, Proc. Natl. Acad. Sci. USA, 87, 5578 (1990). doi:10.1073/pnas.87.14.5578 PMID:2164689
– reference: [19] L. J. Bailey, T. J. Cluett, A. Reyes, T. A. Prolla, J. Poulton, C. Leeuwenburgh, I. J. Holt, W. W. Li, W. S. Noble, Nucleic Acids Res., 37, 2327 (2009). doi:10.1093/nar/gkp091 PMID:19458158
– reference: [15] M. Yoneda, N. Osato, S. Hirose, S. Okawa, Fundamentals of Automaton and Linguistic Theory, Kindai Kagakusha (2003), in Japanese.
– reference: [10] M. Itoh, J. C. Nacher, K. Kuma, S. Goto, M. Kanehisa, Genome Biol., 8, R121 (2007). doi:10.1186/gb-2007-8-6-r121 PMID:17588271
– reference: [16] R. D. L. Briandais, File searching using variable length keys, Proc. Western J. Computer Conf., 295–298 (1959)
– reference: [6] C. J. A. Sigrist, E. de Castro, L. Cerutti, B. A. Cuche, N. Hulo, A. Bridge, L. Bougueleret, I. Xenarios, Nucleic Acids Res., 41, D1, D344 (2012). doi:10.1093/nar/gks1067 PMID:23161676
– reference: [18] The UniProt Consortium, Nucleic Acids Res., 45, D1, D158 (2017). doi:10.1093/nar/gkw1099 PMID:27899622
– reference: [3] B. Kobe, A. V. Kajava, Curr. Opin. Struct. Biol., 11, 725 (2001). doi:10.1016/S0959-440X(01)00266-4 PMID:11751054
SSID ssib000750159
ssib001107833
ssj0056974
Score 2.1832526
Snippet ...
SourceID jstage
SourceType Publisher
StartPage 8
SubjectTerms Aho-Corasick algorithm
Motif search
Multiple representation
Sequence binary decision diagram
Sequence motif
Title 系列二分決定グラフを用いたタンパク質配列モチーフの多重表現
URI https://www.jstage.jst.go.jp/article/jccj/19/1/19_2019-0028/_article/-char/ja
Volume 19
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX Journal of Computer Chemistry, Japan, 2020, Vol.19(1), pp.8-17
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpV29b9QwFI-qY4AF8Sm-1QFPKHBJ7MQeGJJrThUSTEV0i5KcM9xQqqpd2O7CRwcqBAIhdUEghsJQQN0Kgj8mHG3_C96znfugIFFYonfP7z3_7GfHzzl_WNZleO16TDSpzbxC2DT1PHgPCt-W0PFg9iDSXF0Gc_OWP3ub3phn81ONxtiqpZXl7Gp-77f7Sv7Fq8ADv-Iu2QN4dmgUGECDf-EJHobnX_mYxAGJPBJFJGaEcyICElMShYS3DIf7JPZJ5CATOGFMBBAe4S6JmorA_8kNIZhJEi5aFpSEXHEcwqkhRLtWbxstAGDUHZMUQhJHfgh5CcIBycwYQp2pawju1HZakzAcRIuYqcIMdgJlh5PQUcDgZ5tE8R_C6_q6iiut-ko7vSh4cdQdsGrAFiBGAhALFME8BcBxMU8REU5H8gpNGCgRF2vZyEPtRooLJiJvXJ6HJGwiaCg56Bp5KAeWyScCXBSP5AUJI-QhHihwpOWVK8CHBg8b_1LjNoe9StmDXJgiWiRs1a7y9rmK1m5gk7Wv_cqwaMJX5Z0hoa9aFXDCsSHMo-rYTx3GyBHP43q3-nDcE_v6tx7E-Fg0pDfW_jrOulT909_N8y6ujhQ2Tt1HEcVwnafpGQkKJo5IHHygQoIKSZ2MGwyTLsxyDrkw2dPD62RQOx504xcLdUO2jreYLwJ9dbUptz6aFSFemwQIQWYXplz1ck0VQc4ds46atjkdajjHraluesI6PGyeJ607O1ufB6svv28_Hqw-_PFpe7C5XvU_VuW7qnxR9Z_tPN-oever3quq_60qt6ryadX_sLv1fu_BGmhV5Zuq7FXlFxTubQ7eru89Wtt9vbHz5Ospa64dz7VmbXPxid3F06lsh8ksSKEuaJYxeH1mWSED4eeOzCj3i2YRNEXHc3yZpoyluLkulVQWEI7LIOuk3mmrsXB3QZ6xpqUrZcCLHKZtHi18N0uFhAC_EEHuZJ2OOGtd11WSLOrDbZKDuezcf-qft45gT9HfNC9YjeWlFXkRovzl7JJqBD8BJ-DUig
linkProvider ABC ChemistRy
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E7%B3%BB%E5%88%97%E4%BA%8C%E5%88%86%E6%B1%BA%E5%AE%9A%E3%82%B0%E3%83%A9%E3%83%95%E3%82%92%E7%94%A8%E3%81%84%E3%81%9F%E3%82%BF%E3%83%B3%E3%83%91%E3%82%AF%E8%B3%AA%E9%85%8D%E5%88%97%E3%83%A2%E3%83%81%E3%83%BC%E3%83%95%E3%81%AE%E5%A4%9A%E9%87%8D%E8%A1%A8%E7%8F%BE&rft.jtitle=Journal+of+Computer+Chemistry%2C+Japan&rft.au=%E6%A1%82%E6%A8%B9%2C+%E5%93%B2%E9%9B%84&rft.au=%E5%A4%A7%E5%92%8C%2C+%E5%BA%B7%E5%B9%B3&rft.au=%E5%8A%A0%E8%97%A4%2C+%E5%8D%9A%E6%98%8E&rft.au=%E9%AB%98%E6%A9%8B%2C+%E7%94%B1%E9%9B%85&rft.date=2020&rft.pub=%E6%97%A5%E6%9C%AC%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%8C%96%E5%AD%A6%E4%BC%9A&rft.issn=1347-1767&rft.eissn=1347-3824&rft.volume=19&rft.issue=1&rft.spage=8&rft.epage=17&rft_id=info:doi/10.2477%2Fjccj.2019-0028&rft.externalDocID=article_jccj_19_1_19_2019_0028_article_char_ja
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1347-1767&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1347-1767&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1347-1767&client=summon