基于ARM+FPGA异构平台的目标检测加速模块设计与实现
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块.该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度.实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性....
Saved in:
Published in | 北京大学学报(自然科学版) Vol. 58; no. 6; pp. 1035 - 1041 |
---|---|
Main Authors | , , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
北京大学软件与微电子学院, 北京 102600%北京航天自动控制研究所, 北京 100070%北京大学集成电路学院, 北京 100871
20.11.2022
|
Subjects | |
Online Access | Get full text |
ISSN | 0479-8023 |
DOI | 10.13209/j.0479-8023.2022.089 |
Cover
Summary: | 为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块.该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度.实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性. |
---|---|
ISSN: | 0479-8023 |
DOI: | 10.13209/j.0479-8023.2022.089 |