多核数字信号处理器矩阵乘卷积算法性能评测

TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv.该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能.实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现...

Full description

Saved in:
Bibliographic Details
Published in国防科技大学学报 Vol. 45; no. 1; pp. 86 - 94
Main Authors 王庆林, 裴向东, 廖林玉, 王浩旭, 李荣春, 梅松竹, 李东升
Format Journal Article
LanguageChinese
Published 国防科技大学 计算机学院, 湖南 长沙 410073 01.02.2023
国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073
Subjects
Online AccessGet full text
ISSN1001-2486
DOI10.11887/j.cn.202301009

Cover

Abstract TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv.该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能.实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速.
AbstractList TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv.该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能.实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速.
Author 王浩旭
王庆林
裴向东
李荣春
李东升
梅松竹
廖林玉
AuthorAffiliation 国防科技大学 计算机学院, 湖南 长沙 410073;国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073
AuthorAffiliation_xml – name: 国防科技大学 计算机学院, 湖南 长沙 410073;国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073
Author_FL LI Rongchun
WANG Qinglin
PEI Xiangdong
LI Dongsheng
LIAO Linyu
WANG Haoxu
MEI Songzhu
Author_FL_xml – sequence: 1
  fullname: WANG Qinglin
– sequence: 2
  fullname: PEI Xiangdong
– sequence: 3
  fullname: LIAO Linyu
– sequence: 4
  fullname: WANG Haoxu
– sequence: 5
  fullname: LI Rongchun
– sequence: 6
  fullname: MEI Songzhu
– sequence: 7
  fullname: LI Dongsheng
Author_xml – sequence: 1
  fullname: 王庆林
– sequence: 2
  fullname: 裴向东
– sequence: 3
  fullname: 廖林玉
– sequence: 4
  fullname: 王浩旭
– sequence: 5
  fullname: 李荣春
– sequence: 6
  fullname: 梅松竹
– sequence: 7
  fullname: 李东升
BookMark eNrjYmDJy89LZWAQNzTQMzS0sDDXz9JLztMzMjAyNjA0MLBkYeAEUoa6RiYWZhwMvMXFmUlAKUMzc0NzQ04Gm6dLZj1bsOPZ1A1P105_sn_h0_7tT5e0PJ_Q9nTmiufzV76csfXJzhlPe7c_X77--brpzzZPfdaw_EXz3hfrW55t7eZhYE1LzClO5YXS3Ayhbq4hzh66Pv7uns6OPrrFhgYmlrpmFolJiUaGpsYGSQbGpmYmqWaGKQbJhmmp5iapBoYpRpZpyYapZkkpRsaJ5pamFubmJhYGZsaJKQapKZamJsmWxtwMmhBzyxPz0hLz0uOz8kuL8oA2xqenZWelVFQkwX1rDABbCWD7
ClassificationCodes TN95
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.11887/j.cn.202301009
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Military & Naval Science
DocumentTitle_FL Evaluating matrix multiplication-based convolution algorithm on multi-core digital signal processors
EndPage 94
ExternalDocumentID gfkjdxxb202301009
GrantInformation_xml – fundername: 国家自然科学基金
  funderid: (62002365)
GroupedDBID -03
2B.
4A8
5XA
5XD
92H
92I
93N
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CEKLB
CW9
PSX
TCJ
TGT
TN5
U1G
U5M
ID FETCH-LOGICAL-s1049-68aba21530b03564e61d0c1fe74e01d29fc1e6bd23a79587748063ad0ed954c93
ISSN 1001-2486
IngestDate Thu May 29 04:04:51 EDT 2025
IsPeerReviewed false
IsScholarly true
Issue 1
Keywords 多核数字信号处理器
卷积神经网络
卷积算法
算法优化
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1049-68aba21530b03564e61d0c1fe74e01d29fc1e6bd23a79587748063ad0ed954c93
PageCount 9
ParticipantIDs wanfang_journals_gfkjdxxb202301009
PublicationCentury 2000
PublicationDate 2023-02-01
PublicationDateYYYYMMDD 2023-02-01
PublicationDate_xml – month: 02
  year: 2023
  text: 2023-02-01
  day: 01
PublicationDecade 2020
PublicationTitle 国防科技大学学报
PublicationTitle_FL Journal of National University of Defense Technology
PublicationYear 2023
Publisher 国防科技大学 计算机学院, 湖南 长沙 410073
国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073
Publisher_xml – name: 国防科技大学 计算机学院, 湖南 长沙 410073
– name: 国防科技大学 并行与分布处理国防科技重点实验室, 湖南 长沙 410073%国防科技大学 计算机学院, 湖南 长沙 410073
SSID ssib023167171
ssib057620141
ssib051370975
ssib001129263
ssj0000556656
Score 2.352317
Snippet TN95; 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择.针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal...
SourceID wanfang
SourceType Aggregation Database
StartPage 86
Title 多核数字信号处理器矩阵乘卷积算法性能评测
URI https://d.wanfangdata.com.cn/periodical/gfkjdxxb202301009
Volume 45
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR3LahRBcMjj4kV8Ep8sYnsJoz0zPT1d4GUmO0sQk4sJ5BbmtRGFFfKAmJNg8CKil5DoRYVAzEEjSIgexJ_J7sa_sKq3d2dDcoiBZejtruqq6pqeqhqqayzrdl7nGU9EaqMplrbIU8dWXi5sVaSocnAzT9BB4YlJOT4tHsz4MwOD231ZS0uL6d1s5dhzJafRKvahXumU7H9otjcpdmAb9YtX1DBeT6RjFvssFAxCFksWchYpaoDPIq6HqgwCFgsW1VjoUI-qsSgwWEqwOGDAmZLUA8BCpXsQGFgMDBSLfI2u24Re1egBC_FX041Yk5As8oguNhSn0Vgx5bGoSg2EJFqSZlNRvzes6UYarEPONZODo6cKabYOt2FgJAplX0PDhH73riFsFSMRAolCLRmuB_FYgiBDyJnQtLmmJGjhYKwEQeSIQYncnReOIaTFogWTBGiqW5rXKK7Xzbw2N_7pBB7VTMdah31LDmMkY7kYoHXo0qbRbIEWQWsNglE97tOtQGMuwo4Kyl3x-swSJb65whQNN3arU4bz0P7sGKFubXH9p_MJ6aOGUtG7JrSUGRUBxjgUSUDpE_QyNefqT5_ky8tpD2bQGnaDgDIihsPqxMNHpe-NnqNb1nJzqcSCU8YavuMFHEpfFeNcl5KMey9EqaqT1F9b7klrSnERr_cOc6qP2DXqSWOuzxucOmedNWFcJezsyfPWwMrjC9bIhC55P_-8cqcymeBGrxjLedG639z80Pr0s7X2vfl1ff_P5-bbvebmavvdq-b7L-2P2383dvd_bTTf7LW3dtrf1ls_1lovtg5e_j7YWW3tvr5kTdfiqbFx23y4xF5wMOK2pUrSBH1pj6ccH4GikE7OM6deBKLgTu5CPXMKmeaulwTgK4zAFEYKSc6LHHyRgXfZGmo8axQjVkUpkG5d-VkWpAJApTJBjETlhV_wohBXrFtmIWbNg2lh9ojOrp4E6Jp1ptwX162hxfml4gY63IvpTaPqf_lXn8g
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%A4%9A%E6%A0%B8%E6%95%B0%E5%AD%97%E4%BF%A1%E5%8F%B7%E5%A4%84%E7%90%86%E5%99%A8%E7%9F%A9%E9%98%B5%E4%B9%98%E5%8D%B7%E7%A7%AF%E7%AE%97%E6%B3%95%E6%80%A7%E8%83%BD%E8%AF%84%E6%B5%8B&rft.jtitle=%E5%9B%BD%E9%98%B2%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E5%AD%A6%E6%8A%A5&rft.au=%E7%8E%8B%E5%BA%86%E6%9E%97&rft.au=%E8%A3%B4%E5%90%91%E4%B8%9C&rft.au=%E5%BB%96%E6%9E%97%E7%8E%89&rft.au=%E7%8E%8B%E6%B5%A9%E6%97%AD&rft.date=2023-02-01&rft.pub=%E5%9B%BD%E9%98%B2%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6+%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%AD%A6%E9%99%A2%2C+%E6%B9%96%E5%8D%97+%E9%95%BF%E6%B2%99+410073&rft.issn=1001-2486&rft.volume=45&rft.issue=1&rft.spage=86&rft.epage=94&rft_id=info:doi/10.11887%2Fj.cn.202301009&rft.externalDocID=gfkjdxxb202301009
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fgfkjdxxb%2Fgfkjdxxb.jpg