基于FPGA硬件技术的串并集合排序在雷达系统中的应用

发布时间:2016-04-1 阅读量:1254 来源: 我爱方案网 作者:

【导读】基于FPGA硬件技术,以资源和时间相结合的思路,提出了一种串并结合的比较排序算法。该算法通过对数据的分时并行比较,计算出每个数据在排序中的位置实现数据排序。该算法可在较短的时间内实现数字序列的排序,通过实验证明,资源消耗少,实时性号,通用性强。

在雷达抗干扰处理以及空时二维处理过程中数据排序将必不可免,在传统的DSP、CPU等常规软件排序已经不能够满足雷达系统实时性要求,使用 FPGA排序的趋势将势不可当。FPGA由于具有较高的并行处理能力,目前已成为雷达阵列信号处理中的主流处理器件。计算耗费的时间和消耗的硬件资源成为 处理的主要矛盾,如何解决这个矛盾,本人将提出解决方案。

1 算法描述与分析

排序就是将数据元素的一个任意序列,重新排列成一个按关键字有序的序列。各种传统串行排序算法如冒泡,大多都是以两两之间顺序比较为基础,不能满足 实时性要求。如果将传统的串行排序在FPGA中进行分段串行排序再排序,可以减少排序时间,但却大大增加设计难度。本文提出基于并行比较思路,通过将逻辑 比较结果求和,用此和值确定排序结果的位置,从而达到实现排序结果的目的。

图1:算法示意图

 
假设待排序数据元素个数为N,全并行比较就是在同一时刻将N个数两两比较,再在下一时刻进行累加求和以确定排序结果。这样需要耗费N*N个比较器,如果元素个数较多,将耗费大量逻辑资源。本算法采用N个比较器,用N倍时间实现比较。算法如上图所示。

不同的比较器将有不同的比较结果输出,下表列出了4种比较器输出结果形式。

表1:4种比较器结果形式

2 工程实现

排序算法在FPGA内进行,整个实现过程如下图。使用verilog语言设计,做到模块化、参数化,以适应不同数量的排序以及各自逻辑资源的控制,主要有以下几步:

图2:工程实现框图

1)将流水线上的待排序的Ⅳ个数据存储到RAM中,同时对相等值数量的RAM写零;
2)读取N个赋给N个变量准备比较;
3)读取数据和N个变量同时比较;
4)将比较结果累加求和;
5)将和值作为地址读取此数据的个数,将此个数和累加和相加写到排序结果RAM中,同时将个数加1写入相等值数量的RAM中。
相等值数量RAM主要处理待排序数据流有过个相同数值大小的数据排序的情况。
读取N个赋给N个变量准备比较需要N个时钟周期,比较需要N个时钟周期,多级累加需要3*N个时钟周期(N≤512),相同数值排序需要3*N个时钟周期,合计需要8*N个时钟周期。

3 仿真与验证

本算法Verilog代码以及IP核模块的新建基于Xilinxvp690,功能级仿真在Modsim中完成。图3是待排序数据流截图,待排序数据 是从20到319的300个递增数据,图4是图3输入数据的从小到大的排序结果,其中m_data_h是是排序后原先数据的序号,m_data_l是排序 后从小到大的结果;为了验证相同数值的排序情况,将上述待排序数据的第2、39个数改成和第1个数相同,即20,再排序,其结果如图5所示,圆圈标出了相 同数据及相同数据的排序结果。

4 算法在工程应用中的性能分析

通过实际建立工程,综合、仿真分析分别得出128点、256点以及512点排序,分别使用全并行算法、串行(冒泡)算法和本文串并结合的算法得到的 逻辑资源使用情况以及运算时钟周期。从表中可以看出,全并行算法速度最快,但数据点数翻倍时消耗的资源消耗平方级翻倍,256点排序已经超出了芯片的范 围;串行冒泡算法消耗的资源较少,但数据点数翻倍时消耗的时间却是平方级翻倍;只有本文提出的算法消耗的资源和时钟周期都能接收,具有可行性意义。

表2:不同算法消耗的资源和时间

采用240 MHz时钟,512点排序,只需要8μs。

5 结束语

排序在雷达信号处理过程中只是其中的一个功能,这要求我们逻辑资源不能消耗太多,而雷达的实时性要求又要求我们必须快速的完成排序。从上述论述可 知,单纯的串行和并行排序都不能满足要求,只有本文这种基于FPGA技术的串并行结合处理排序算法才能够满足实际工程要求,达到了实时排序的效果。该算法 具有通用性,可以应用到各种数据快速排序运算领域。

相关资讯
“中国芯”逆袭时刻:新唐携7大新品打造全场景AIoT解决方案矩阵

在万物互联与智能化浪潮席卷全球的今天,新唐科技以颠覆性创新奏响行业强音。4月25日,这场历时10天、横跨七城的科技盛宴在深圳迎来高潮,以"创新驱动AI、新能源与车用科技"为主题,汇聚全球顶尖行业领袖,首次公开七大核心产品矩阵,展现从芯片设计到智能生态的全链条创新能力,为半导体产业转型升级注入新动能。

半导体先进制程技术博弈:台积电、英特尔与三星的差异化路径

在2025年北美技术研讨会上,台积电正式宣布其A14(1.4nm)工艺将于2028年量产,并明确表示无需依赖ASML最新一代High NA EUV光刻机。这一决策背后,折射出全球半导体巨头在技术路线、成本控制和市场竞争中的深层博弈。

嵌入式主板EMB-3128:轻量级边缘计算的工业级解决方案

随着AIoT技术的快速落地,智能设备对高性能、低功耗嵌入式硬件的需求持续攀升。华北工控推出的EMB-3128嵌入式主板,搭载Intel® Alder Lake-N系列及Core™ i3-N305处理器,以高能效比设计、工业级可靠性及丰富的接口配置,成为轻量级边缘AI计算的理想选择。该主板支持DDR5内存、多模态扩展接口及宽温运行环境,可广泛应用于智能家居、工业自动化、智慧零售等场景,助力产业智能化升级。

从ASMI财报看行业趋势:AI芯片需求爆发如何重塑半导体设备市场?

作为全球半导体沉积设备领域的龙头企业,荷兰ASM国际(ASMI)近日发布2024年第一季度财报,展现强劲增长动能。财报显示,公司当季新增订单额达8.34亿欧元(按固定汇率计算),同比增长14%,显著超出市场预期的8.08亿欧元。这一表现主要受益于人工智能芯片制造设备需求激增与中国市场的战略性突破,同时反映出半导体产业技术迭代与地缘经济博弈的双重影响。

车规级SerDes国产替代提速:解析纳芯微NLS9116/NLS9246技术优势与市场潜力

随着汽车智能化加速,车载摄像头、激光雷达、显示屏等传感器数量激增,数据传输带宽需求呈指数级增长。传统国际厂商基于私有协议(如TI的FPD-Link、ADI的GMSL)垄断车载SerDes市场,导致车企供应链弹性不足、成本高企。2025年4月,纳芯微电子发布基于HSMT公有协议的全链路国产化SerDes芯片组(NLS9116加串器与NLS9246解串器),通过协议解耦、性能优化与供应链自主可控,为ADAS、智能座舱等场景提供高性价比解决方案,标志着国产车规级芯片从“跟跑”迈向“并跑” 。