系列二分決定グラフを用いたタンパク質配列モチーフの多重表現
本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB...
Saved in:
Published in | Journal of Computer Chemistry, Japan Vol. 19; no. 1; pp. 8 - 17 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Japanese |
Published |
日本コンピュータ化学会
2020
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Abstract | 本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB/Swiss-Prot (Rel. 2017_09)から得られた555,594の全てのアミノ酸配列に対して検索した.PROSITEパターンを使用した同様の検索結果と比較して,本手法は,適合率,再現率,およびF値において良好な結果を示した. |
---|---|
AbstractList | 本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB/Swiss-Prot (Rel. 2017_09)から得られた555,594の全てのアミノ酸配列に対して検索した.PROSITEパターンを使用した同様の検索結果と比較して,本手法は,適合率,再現率,およびF値において良好な結果を示した. |
Author | 加藤, 博明 大和, 康平 桂樹, 哲雄 高橋, 由雅 |
Author_xml | – sequence: 1 fullname: 桂樹, 哲雄 organization: 豊橋技術科学大学 情報・知能工学系 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1 – sequence: 1 fullname: 大和, 康平 organization: 豊橋技術科学大学 情報・知能工学系 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1 – sequence: 1 fullname: 加藤, 博明 organization: 広島商船高等専門学校 流通情報工学科 〒725-0231 広島県豊田郡大崎上島町東野4272-1 – sequence: 1 fullname: 高橋, 由雅 organization: 豊橋技術科学大学 情報・知能工学系 〒441-8580 愛知県豊橋市天伯町雲雀ヶ丘1-1 |
BookMark | eNo9kMtKw0AUhgepYK3d-hapc0kyyVLqFQpuCi6HmXSiDbVK0o3LZLx0YRFFEboRxUV1UZXuqujDjLHtW2iwuPnPD-c7Z_HNg1xzvykBWESwhE1KlwLPC0oYIteAEDszII-ISQ3iYDM37YjadA4Uo6guIITUgshy82B7NHhL2zdfw7O0ffL9Okz7XZ28aPWo1bVOLkdXPR0f6fhWJ59aDbS60MnzePA0Oe78Xml1r1Ws1XsGx_30oTs57YzveqPzjwUw6_NGJIvTWQDVtdVqecOobK1vlpcrRoCxAw1kSUE5ptQUwuKECOFL6toeksJ0bB_6FLo1gmzJuWX9csTh0pQ-xFhSUeOkAFb-3gZRi-9IdhDW93h4yHjYqnsNyTItDLkMZZHpYZme_7W3y0MWcPIDD9h-6g |
ContentType | Journal Article |
Copyright | 2020 日本コンピュータ化学会 |
Copyright_xml | – notice: 2020 日本コンピュータ化学会 |
DOI | 10.2477/jccj.2019-0028 |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Chemistry |
EISSN | 1347-3824 |
EndPage | 17 |
ExternalDocumentID | article_jccj_19_1_19_2019_0028_article_char_ja |
GrantInformation | 栢森情報科学振興財団 |
GroupedDBID | 29K 2WC ACIWK ALMA_UNASSIGNED_HOLDINGS D-I E3Z EBS EJD GX1 HH5 JSF JSH KQ8 OK1 OVT PQQKQ RJT RNS RZJ TKC XSB |
ID | FETCH-LOGICAL-j2280-15eb7a2774bb5a33bbfe796c1eb486f0f709d316eaa55a2738ae4ef022e7bda3 |
ISSN | 1347-1767 |
IngestDate | Wed Sep 03 06:08:55 EDT 2025 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | true |
Issue | 1 |
Language | Japanese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-j2280-15eb7a2774bb5a33bbfe796c1eb486f0f709d316eaa55a2738ae4ef022e7bda3 |
OpenAccessLink | https://www.jstage.jst.go.jp/article/jccj/19/1/19_2019-0028/_article/-char/ja |
PageCount | 10 |
ParticipantIDs | jstage_primary_article_jccj_19_1_19_2019_0028_article_char_ja |
PublicationCentury | 2000 |
PublicationDate | 2020 |
PublicationDateYYYYMMDD | 2020-01-01 |
PublicationDate_xml | – year: 2020 text: 2020 |
PublicationDecade | 2020 |
PublicationTitle | Journal of Computer Chemistry, Japan |
PublicationYear | 2020 |
Publisher | 日本コンピュータ化学会 |
Publisher_xml | – name: 日本コンピュータ化学会 |
References | [1] D. W. Mount, Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory (2004) [7] R. D. Finn, P. Coggill, R. Y. Eberhardt, S. R. Eddy, J. Mistry, A. L. Mitchell, S. C. Potter, M. Punta, M. Qureshi, A. Sangrador-Vegas, G. A. Salazar, J. Tate, A. Bateman, Nucleic Acids Res., 44, D1, D279 (2016). doi:10.1093/nar/gkv1344 PMID:26673716 [10] M. Itoh, J. C. Nacher, K. Kuma, S. Goto, M. Kanehisa, Genome Biol., 8, R121 (2007). doi:10.1186/gb-2007-8-6-r121 PMID:17588271 [3] B. Kobe, A. V. Kajava, Curr. Opin. Struct. Biol., 11, 725 (2001). doi:10.1016/S0959-440X(01)00266-4 PMID:11751054 [17] A. V. Aho, M. J. Corasick, Commun. ACM, 18, 333 (1975). doi:10.1145/360825.360855 [5] T. Akutsu, Mathematics and Algorithms of Bioinformatics, Kyoritsu Shuppan (2007), in Japanese. [11] Z. Wang, X. C. Zhang, M. H. Le, D. Xu, G. Stacey, J. Cheng, PLoS One, 6, e17906 (2011). doi:10.1371/journal.pone.0017906 PMID:21455299 [12] E. Loekito, J. Bailey, J. Pei, Knowl. Inf. Syst., 24, 235 (2010). doi:10.1007/s10115-009-0252-9 [15] M. Yoneda, N. Osato, S. Hirose, S. Okawa, Fundamentals of Automaton and Linguistic Theory, Kindai Kagakusha (2003), in Japanese. [6] C. J. A. Sigrist, E. de Castro, L. Cerutti, B. A. Cuche, N. Hulo, A. Bridge, L. Bougueleret, I. Xenarios, Nucleic Acids Res., 41, D1, D344 (2012). doi:10.1093/nar/gks1067 PMID:23161676 [2] H. Toh, M. Ono, K. Saigo, T. Miyata, Nature, 315, 691 (1985). doi:10.1038/315691a0 [14] ERATO Minato Discrete Structure Manipulation System Project, Super-High-Speed Graph Enumeration Algorithm, Morikita Shuppan (2015), in Japanese. [16] R. D. L. Briandais, File searching using variable length keys, Proc. Western J. Computer Conf., 295–298 (1959) [9] H. E. Van Wart, H. Birkedal-Hansen, Proc. Natl. Acad. Sci. USA, 87, 5578 (1990). doi:10.1073/pnas.87.14.5578 PMID:2164689 [13] S. Denzumi, R. Yoshinaka, H. Arimura, S. Minato, Discrete Appl. Math., 212, 61 (2016). doi:10.1016/j.dam.2014.11.022 [18] The UniProt Consortium, Nucleic Acids Res., 45, D1, D158 (2017). doi:10.1093/nar/gkw1099 PMID:27899622 [4] S. Lanouette, J. A. Davey, F. Elisma, Z. Ning, D. Figeys, R. A. Chica, J. F. Couture, Structure, 23, 206 (2015). doi:10.1016/j.str.2014.11.004 PMID:25533488 [8] S. Azuma, H. Kato, Development of the structural feature analysis system based on the motif combination pattern of proteins, Chem-Bio Informatics Society Annual Meeting 2015, P3–7 (2015) [19] L. J. Bailey, T. J. Cluett, A. Reyes, T. A. Prolla, J. Poulton, C. Leeuwenburgh, I. J. Holt, W. W. Li, W. S. Noble, Nucleic Acids Res., 37, 2327 (2009). doi:10.1093/nar/gkp091 PMID:19458158 |
References_xml | – reference: [1] D. W. Mount, Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory (2004) – reference: [4] S. Lanouette, J. A. Davey, F. Elisma, Z. Ning, D. Figeys, R. A. Chica, J. F. Couture, Structure, 23, 206 (2015). doi:10.1016/j.str.2014.11.004 PMID:25533488 – reference: [5] T. Akutsu, Mathematics and Algorithms of Bioinformatics, Kyoritsu Shuppan (2007), in Japanese. – reference: [14] ERATO Minato Discrete Structure Manipulation System Project, Super-High-Speed Graph Enumeration Algorithm, Morikita Shuppan (2015), in Japanese. – reference: [13] S. Denzumi, R. Yoshinaka, H. Arimura, S. Minato, Discrete Appl. Math., 212, 61 (2016). doi:10.1016/j.dam.2014.11.022 – reference: [2] H. Toh, M. Ono, K. Saigo, T. Miyata, Nature, 315, 691 (1985). doi:10.1038/315691a0 – reference: [12] E. Loekito, J. Bailey, J. Pei, Knowl. Inf. Syst., 24, 235 (2010). doi:10.1007/s10115-009-0252-9 – reference: [17] A. V. Aho, M. J. Corasick, Commun. ACM, 18, 333 (1975). doi:10.1145/360825.360855 – reference: [11] Z. Wang, X. C. Zhang, M. H. Le, D. Xu, G. Stacey, J. Cheng, PLoS One, 6, e17906 (2011). doi:10.1371/journal.pone.0017906 PMID:21455299 – reference: [7] R. D. Finn, P. Coggill, R. Y. Eberhardt, S. R. Eddy, J. Mistry, A. L. Mitchell, S. C. Potter, M. Punta, M. Qureshi, A. Sangrador-Vegas, G. A. Salazar, J. Tate, A. Bateman, Nucleic Acids Res., 44, D1, D279 (2016). doi:10.1093/nar/gkv1344 PMID:26673716 – reference: [8] S. Azuma, H. Kato, Development of the structural feature analysis system based on the motif combination pattern of proteins, Chem-Bio Informatics Society Annual Meeting 2015, P3–7 (2015) – reference: [9] H. E. Van Wart, H. Birkedal-Hansen, Proc. Natl. Acad. Sci. USA, 87, 5578 (1990). doi:10.1073/pnas.87.14.5578 PMID:2164689 – reference: [19] L. J. Bailey, T. J. Cluett, A. Reyes, T. A. Prolla, J. Poulton, C. Leeuwenburgh, I. J. Holt, W. W. Li, W. S. Noble, Nucleic Acids Res., 37, 2327 (2009). doi:10.1093/nar/gkp091 PMID:19458158 – reference: [15] M. Yoneda, N. Osato, S. Hirose, S. Okawa, Fundamentals of Automaton and Linguistic Theory, Kindai Kagakusha (2003), in Japanese. – reference: [10] M. Itoh, J. C. Nacher, K. Kuma, S. Goto, M. Kanehisa, Genome Biol., 8, R121 (2007). doi:10.1186/gb-2007-8-6-r121 PMID:17588271 – reference: [16] R. D. L. Briandais, File searching using variable length keys, Proc. Western J. Computer Conf., 295–298 (1959) – reference: [6] C. J. A. Sigrist, E. de Castro, L. Cerutti, B. A. Cuche, N. Hulo, A. Bridge, L. Bougueleret, I. Xenarios, Nucleic Acids Res., 41, D1, D344 (2012). doi:10.1093/nar/gks1067 PMID:23161676 – reference: [18] The UniProt Consortium, Nucleic Acids Res., 45, D1, D158 (2017). doi:10.1093/nar/gkw1099 PMID:27899622 – reference: [3] B. Kobe, A. V. Kajava, Curr. Opin. Struct. Biol., 11, 725 (2001). doi:10.1016/S0959-440X(01)00266-4 PMID:11751054 |
SSID | ssib000750159 ssib001107833 ssj0056974 |
Score | 2.1832526 |
Snippet | ... |
SourceID | jstage |
SourceType | Publisher |
StartPage | 8 |
SubjectTerms | Aho-Corasick algorithm Motif search Multiple representation Sequence binary decision diagram Sequence motif |
Title | 系列二分決定グラフを用いたタンパク質配列モチーフの多重表現 |
URI | https://www.jstage.jst.go.jp/article/jccj/19/1/19_2019-0028/_article/-char/ja |
Volume | 19 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | Journal of Computer Chemistry, Japan, 2020, Vol.19(1), pp.8-17 |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpV29b9QwFI-qY4AF8Sm-1QFPKHBJ7MQeGJJrThUSTEV0i5KcM9xQqqpd2O7CRwcqBAIhdUEghsJQQN0Kgj8mHG3_C96znfugIFFYonfP7z3_7GfHzzl_WNZleO16TDSpzbxC2DT1PHgPCt-W0PFg9iDSXF0Gc_OWP3ub3phn81ONxtiqpZXl7Gp-77f7Sv7Fq8ADv-Iu2QN4dmgUGECDf-EJHobnX_mYxAGJPBJFJGaEcyICElMShYS3DIf7JPZJ5CATOGFMBBAe4S6JmorA_8kNIZhJEi5aFpSEXHEcwqkhRLtWbxstAGDUHZMUQhJHfgh5CcIBycwYQp2pawju1HZakzAcRIuYqcIMdgJlh5PQUcDgZ5tE8R_C6_q6iiut-ko7vSh4cdQdsGrAFiBGAhALFME8BcBxMU8REU5H8gpNGCgRF2vZyEPtRooLJiJvXJ6HJGwiaCg56Bp5KAeWyScCXBSP5AUJI-QhHihwpOWVK8CHBg8b_1LjNoe9StmDXJgiWiRs1a7y9rmK1m5gk7Wv_cqwaMJX5Z0hoa9aFXDCsSHMo-rYTx3GyBHP43q3-nDcE_v6tx7E-Fg0pDfW_jrOulT909_N8y6ujhQ2Tt1HEcVwnafpGQkKJo5IHHygQoIKSZ2MGwyTLsxyDrkw2dPD62RQOx504xcLdUO2jreYLwJ9dbUptz6aFSFemwQIQWYXplz1ck0VQc4ds46atjkdajjHraluesI6PGyeJ607O1ufB6svv28_Hqw-_PFpe7C5XvU_VuW7qnxR9Z_tPN-oever3quq_60qt6ryadX_sLv1fu_BGmhV5Zuq7FXlFxTubQ7eru89Wtt9vbHz5Ospa64dz7VmbXPxid3F06lsh8ksSKEuaJYxeH1mWSED4eeOzCj3i2YRNEXHc3yZpoyluLkulVQWEI7LIOuk3mmrsXB3QZ6xpqUrZcCLHKZtHi18N0uFhAC_EEHuZJ2OOGtd11WSLOrDbZKDuezcf-qft45gT9HfNC9YjeWlFXkRovzl7JJqBD8BJ-DUig |
linkProvider | ABC ChemistRy |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E7%B3%BB%E5%88%97%E4%BA%8C%E5%88%86%E6%B1%BA%E5%AE%9A%E3%82%B0%E3%83%A9%E3%83%95%E3%82%92%E7%94%A8%E3%81%84%E3%81%9F%E3%82%BF%E3%83%B3%E3%83%91%E3%82%AF%E8%B3%AA%E9%85%8D%E5%88%97%E3%83%A2%E3%83%81%E3%83%BC%E3%83%95%E3%81%AE%E5%A4%9A%E9%87%8D%E8%A1%A8%E7%8F%BE&rft.jtitle=Journal+of+Computer+Chemistry%2C+Japan&rft.au=%E6%A1%82%E6%A8%B9%2C+%E5%93%B2%E9%9B%84&rft.au=%E5%A4%A7%E5%92%8C%2C+%E5%BA%B7%E5%B9%B3&rft.au=%E5%8A%A0%E8%97%A4%2C+%E5%8D%9A%E6%98%8E&rft.au=%E9%AB%98%E6%A9%8B%2C+%E7%94%B1%E9%9B%85&rft.date=2020&rft.pub=%E6%97%A5%E6%9C%AC%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%8C%96%E5%AD%A6%E4%BC%9A&rft.issn=1347-1767&rft.eissn=1347-3824&rft.volume=19&rft.issue=1&rft.spage=8&rft.epage=17&rft_id=info:doi/10.2477%2Fjccj.2019-0028&rft.externalDocID=article_jccj_19_1_19_2019_0028_article_char_ja |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1347-1767&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1347-1767&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1347-1767&client=summon |