多核数字信号处理器矩阵乘卷积算法性能评测
TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv.该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能.实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现...
Saved in:
Published in | 国防科技大学学报 Vol. 45; no. 1; pp. 86 - 94 |
---|---|
Main Authors | , , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
国防科技大学 计算机学院, 湖南 长沙 410073
01.02.2023
国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073 |
Subjects | |
Online Access | Get full text |
ISSN | 1001-2486 |
DOI | 10.11887/j.cn.202301009 |
Cover
Abstract | TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv.该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能.实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速. |
---|---|
AbstractList | TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv.该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能.实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速. |
Author | 王浩旭 王庆林 裴向东 李荣春 李东升 梅松竹 廖林玉 |
AuthorAffiliation | 国防科技大学 计算机学院, 湖南 长沙 410073;国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073 |
AuthorAffiliation_xml | – name: 国防科技大学 计算机学院, 湖南 长沙 410073;国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073 |
Author_FL | LI Rongchun WANG Qinglin PEI Xiangdong LI Dongsheng LIAO Linyu WANG Haoxu MEI Songzhu |
Author_FL_xml | – sequence: 1 fullname: WANG Qinglin – sequence: 2 fullname: PEI Xiangdong – sequence: 3 fullname: LIAO Linyu – sequence: 4 fullname: WANG Haoxu – sequence: 5 fullname: LI Rongchun – sequence: 6 fullname: MEI Songzhu – sequence: 7 fullname: LI Dongsheng |
Author_xml | – sequence: 1 fullname: 王庆林 – sequence: 2 fullname: 裴向东 – sequence: 3 fullname: 廖林玉 – sequence: 4 fullname: 王浩旭 – sequence: 5 fullname: 李荣春 – sequence: 6 fullname: 梅松竹 – sequence: 7 fullname: 李东升 |
BookMark | eNrjYmDJy89LZWAQNzTQMzS0sDDXz9JLztMzMjAyNjA0MLBkYeAEUoa6RiYWZhwMvMXFmUlAKUMzc0NzQ04Gm6dLZj1bsOPZ1A1P105_sn_h0_7tT5e0PJ_Q9nTmiufzV76csfXJzhlPe7c_X77--brpzzZPfdaw_EXz3hfrW55t7eZhYE1LzClO5YXS3Ayhbq4hzh66Pv7uns6OPrrFhgYmlrpmFolJiUaGpsYGSQbGpmYmqWaGKQbJhmmp5iapBoYpRpZpyYapZkkpRsaJ5pamFubmJhYGZsaJKQapKZamJsmWxtwMmhBzyxPz0hLz0uOz8kuL8oA2xqenZWelVFQkwX1rDABbCWD7 |
ClassificationCodes | TN95 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.11887/j.cn.202301009 |
DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Military & Naval Science |
DocumentTitle_FL | Evaluating matrix multiplication-based convolution algorithm on multi-core digital signal processors |
EndPage | 94 |
ExternalDocumentID | gfkjdxxb202301009 |
GrantInformation_xml | – fundername: 国家自然科学基金 funderid: (62002365) |
GroupedDBID | -03 2B. 4A8 5XA 5XD 92H 92I 93N ABJNI ACGFS ALMA_UNASSIGNED_HOLDINGS CCEZO CEKLB CW9 PSX TCJ TGT TN5 U1G U5M |
ID | FETCH-LOGICAL-s1049-68aba21530b03564e61d0c1fe74e01d29fc1e6bd23a79587748063ad0ed954c93 |
ISSN | 1001-2486 |
IngestDate | Thu May 29 04:04:51 EDT 2025 |
IsPeerReviewed | false |
IsScholarly | true |
Issue | 1 |
Keywords | 多核数字信号处理器 卷积神经网络 卷积算法 算法优化 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-s1049-68aba21530b03564e61d0c1fe74e01d29fc1e6bd23a79587748063ad0ed954c93 |
PageCount | 9 |
ParticipantIDs | wanfang_journals_gfkjdxxb202301009 |
PublicationCentury | 2000 |
PublicationDate | 2023-02-01 |
PublicationDateYYYYMMDD | 2023-02-01 |
PublicationDate_xml | – month: 02 year: 2023 text: 2023-02-01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | 国防科技大学学报 |
PublicationTitle_FL | Journal of National University of Defense Technology |
PublicationYear | 2023 |
Publisher | 国防科技大学 计算机学院, 湖南 长沙 410073 国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073 |
Publisher_xml | – name: 国防科技大学 计算机学院, 湖南 长沙 410073 – name: 国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073 |
SSID | ssib023167171 ssib057620141 ssib051370975 ssib001129263 ssj0000556656 |
Score | 2.352317 |
Snippet | TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal... |
SourceID | wanfang |
SourceType | Aggregation Database |
StartPage | 86 |
Title | 多核数字信号处理器矩阵乘卷积算法性能评测 |
URI | https://d.wanfangdata.com.cn/periodical/gfkjdxxb202301009 |
Volume | 45 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR3LahRBcMjj4kV8Ep8sYnsJoz0zPT1d4GUmO0sQk4sJ5BbmtRGFFfKAmJNg8CKil5DoRYVAzEEjSIgexJ_J7sa_sKq3d2dDcoiBZejtruqq6pqeqhqqayzrdl7nGU9EaqMplrbIU8dWXi5sVaSocnAzT9BB4YlJOT4tHsz4MwOD231ZS0uL6d1s5dhzJafRKvahXumU7H9otjcpdmAb9YtX1DBeT6RjFvssFAxCFksWchYpaoDPIq6HqgwCFgsW1VjoUI-qsSgwWEqwOGDAmZLUA8BCpXsQGFgMDBSLfI2u24Re1egBC_FX041Yk5As8oguNhSn0Vgx5bGoSg2EJFqSZlNRvzes6UYarEPONZODo6cKabYOt2FgJAplX0PDhH73riFsFSMRAolCLRmuB_FYgiBDyJnQtLmmJGjhYKwEQeSIQYncnReOIaTFogWTBGiqW5rXKK7Xzbw2N_7pBB7VTMdah31LDmMkY7kYoHXo0qbRbIEWQWsNglE97tOtQGMuwo4Kyl3x-swSJb65whQNN3arU4bz0P7sGKFubXH9p_MJ6aOGUtG7JrSUGRUBxjgUSUDpE_QyNefqT5_ky8tpD2bQGnaDgDIihsPqxMNHpe-NnqNb1nJzqcSCU8YavuMFHEpfFeNcl5KMey9EqaqT1F9b7klrSnERr_cOc6qP2DXqSWOuzxucOmedNWFcJezsyfPWwMrjC9bIhC55P_-8cqcymeBGrxjLedG639z80Pr0s7X2vfl1ff_P5-bbvebmavvdq-b7L-2P2383dvd_bTTf7LW3dtrf1ls_1lovtg5e_j7YWW3tvr5kTdfiqbFx23y4xF5wMOK2pUrSBH1pj6ccH4GikE7OM6deBKLgTu5CPXMKmeaulwTgK4zAFEYKSc6LHHyRgXfZGmo8axQjVkUpkG5d-VkWpAJApTJBjETlhV_wohBXrFtmIWbNg2lh9ojOrp4E6Jp1ptwX162hxfml4gY63IvpTaPqf_lXn8g |
linkProvider | EBSCOhost |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%A4%9A%E6%A0%B8%E6%95%B0%E5%AD%97%E4%BF%A1%E5%8F%B7%E5%A4%84%E7%90%86%E5%99%A8%E7%9F%A9%E9%98%B5%E4%B9%98%E5%8D%B7%E7%A7%AF%E7%AE%97%E6%B3%95%E6%80%A7%E8%83%BD%E8%AF%84%E6%B5%8B&rft.jtitle=%E5%9B%BD%E9%98%B2%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E5%AD%A6%E6%8A%A5&rft.au=%E7%8E%8B%E5%BA%86%E6%9E%97&rft.au=%E8%A3%B4%E5%90%91%E4%B8%9C&rft.au=%E5%BB%96%E6%9E%97%E7%8E%89&rft.au=%E7%8E%8B%E6%B5%A9%E6%97%AD&rft.date=2023-02-01&rft.pub=%E5%9B%BD%E9%98%B2%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6+%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%AD%A6%E9%99%A2%2C+%E6%B9%96%E5%8D%97+%E9%95%BF%E6%B2%99+410073&rft.issn=1001-2486&rft.volume=45&rft.issue=1&rft.spage=86&rft.epage=94&rft_id=info:doi/10.11887%2Fj.cn.202301009&rft.externalDocID=gfkjdxxb202301009 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fgfkjdxxb%2Fgfkjdxxb.jpg |