星载SAR实时成像处理器的片上数据组织及访问策略

TP389.1; 星载SAR成像需对大量输入数据进行实时成像处理,且功耗受限,设计高效率异构阵列处理器是满足功耗约束和实时性要求的有效方法,而片上数据组织结构和访问策略是设计的关键.在分析典型的CSA(chirp scaling algorithm) SAR成像算法的基础上,提取了SAR成像的数据流模型.提出了一种跨区域交叉放置和数据排序同步访问的存储策略,通过片上多级数据缓存结构,有效缓解存储带宽问题,支持FFT/IFFT和相位补偿操作的流水处理,确保成像计算高效执行.基于该存储策略的处理器可实现高达115.2 GOPS的吞吐量,采用65 nm技术可实现高达254 GOPS/W的能效.与CP...

Full description

Saved in:
Bibliographic Details
Published in西北工业大学学报 Vol. 39; no. 1; pp. 126 - 134
Main Authors 王时雨, 张盛兵, 黄小平, 吕浩
Format Journal Article
LanguageChinese
Published 西北工业大学计算机学院,陕西西安710072%西北工业大学计算机学院,陕西西安710072 01.02.2021
空天地海一体化大数据应用技术国家工程实验室,陕西西安710072%西北工业大学计算机学院,陕西西安710072
嵌入式系统集成教育部工程研究中心,陕西西安710072
Subjects
Online AccessGet full text
ISSN1000-2758
DOI10.1051/jnwpu/20213910126

Cover

More Information
Summary:TP389.1; 星载SAR成像需对大量输入数据进行实时成像处理,且功耗受限,设计高效率异构阵列处理器是满足功耗约束和实时性要求的有效方法,而片上数据组织结构和访问策略是设计的关键.在分析典型的CSA(chirp scaling algorithm) SAR成像算法的基础上,提取了SAR成像的数据流模型.提出了一种跨区域交叉放置和数据排序同步访问的存储策略,通过片上多级数据缓存结构,有效缓解存储带宽问题,支持FFT/IFFT和相位补偿操作的流水处理,确保成像计算高效执行.基于该存储策略的处理器可实现高达115.2 GOPS的吞吐量,采用65 nm技术可实现高达254 GOPS/W的能效.与CPU+GPU加速方案相比,性能/功耗比提高了63.4倍.该结构提高了实时性能,降低系统设计的复杂度,具有良好的可扩展性,可满足不同SAR成像平台的需求.
ISSN:1000-2758
DOI:10.1051/jnwpu/20213910126