基于ARM+FPGA异构平台的目标检测加速模块设计与实现

为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块.该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度.实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性....

Full description

Saved in:
Bibliographic Details
Published in北京大学学报(自然科学版) Vol. 58; no. 6; pp. 1035 - 1041
Main Authors 李放, 曹健, 李普, 谢豪, 赵雄波, 王源, 张兴
Format Journal Article
LanguageChinese
Published 北京大学软件与微电子学院, 北京 102600%北京航天自动控制研究所, 北京 100070%北京大学集成电路学院, 北京 100871 20.11.2022
Subjects
Online AccessGet full text
ISSN0479-8023
DOI10.13209/j.0479-8023.2022.089

Cover

More Information
Summary:为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块.该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度.实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性.
ISSN:0479-8023
DOI:10.13209/j.0479-8023.2022.089