发布时间:2016-04-1 阅读量:1302 来源: 我爱方案网 作者:
在雷达抗干扰处理以及空时二维处理过程中数据排序将必不可免,在传统的DSP、CPU等常规软件排序已经不能够满足雷达系统实时性要求,使用 FPGA排序的趋势将势不可当。FPGA由于具有较高的并行处理能力,目前已成为雷达阵列信号处理中的主流处理器件。计算耗费的时间和消耗的硬件资源成为 处理的主要矛盾,如何解决这个矛盾,本人将提出解决方案。
1 算法描述与分析
排序就是将数据元素的一个任意序列,重新排列成一个按关键字有序的序列。各种传统串行排序算法如冒泡,大多都是以两两之间顺序比较为基础,不能满足 实时性要求。如果将传统的串行排序在FPGA中进行分段串行排序再排序,可以减少排序时间,但却大大增加设计难度。本文提出基于并行比较思路,通过将逻辑 比较结果求和,用此和值确定排序结果的位置,从而达到实现排序结果的目的。
图1:算法示意图
假设待排序数据元素个数为N,全并行比较就是在同一时刻将N个数两两比较,再在下一时刻进行累加求和以确定排序结果。这样需要耗费N*N个比较器,如果元素个数较多,将耗费大量逻辑资源。本算法采用N个比较器,用N倍时间实现比较。算法如上图所示。
不同的比较器将有不同的比较结果输出,下表列出了4种比较器输出结果形式。
表1:4种比较器结果形式
2 工程实现
排序算法在FPGA内进行,整个实现过程如下图。使用verilog语言设计,做到模块化、参数化,以适应不同数量的排序以及各自逻辑资源的控制,主要有以下几步:
图2:工程实现框图
1)将流水线上的待排序的Ⅳ个数据存储到RAM中,同时对相等值数量的RAM写零;
2)读取N个赋给N个变量准备比较;
3)读取数据和N个变量同时比较;
4)将比较结果累加求和;
5)将和值作为地址读取此数据的个数,将此个数和累加和相加写到排序结果RAM中,同时将个数加1写入相等值数量的RAM中。
相等值数量RAM主要处理待排序数据流有过个相同数值大小的数据排序的情况。
读取N个赋给N个变量准备比较需要N个时钟周期,比较需要N个时钟周期,多级累加需要3*N个时钟周期(N≤512),相同数值排序需要3*N个时钟周期,合计需要8*N个时钟周期。
3 仿真与验证
本算法Verilog代码以及IP核模块的新建基于Xilinxvp690,功能级仿真在Modsim中完成。图3是待排序数据流截图,待排序数据 是从20到319的300个递增数据,图4是图3输入数据的从小到大的排序结果,其中m_data_h是是排序后原先数据的序号,m_data_l是排序 后从小到大的结果;为了验证相同数值的排序情况,将上述待排序数据的第2、39个数改成和第1个数相同,即20,再排序,其结果如图5所示,圆圈标出了相 同数据及相同数据的排序结果。
4 算法在工程应用中的性能分析
通过实际建立工程,综合、仿真分析分别得出128点、256点以及512点排序,分别使用全并行算法、串行(冒泡)算法和本文串并结合的算法得到的 逻辑资源使用情况以及运算时钟周期。从表中可以看出,全并行算法速度最快,但数据点数翻倍时消耗的资源消耗平方级翻倍,256点排序已经超出了芯片的范 围;串行冒泡算法消耗的资源较少,但数据点数翻倍时消耗的时间却是平方级翻倍;只有本文提出的算法消耗的资源和时钟周期都能接收,具有可行性意义。
表2:不同算法消耗的资源和时间
采用240 MHz时钟,512点排序,只需要8μs。
5 结束语
排序在雷达信号处理过程中只是其中的一个功能,这要求我们逻辑资源不能消耗太多,而雷达的实时性要求又要求我们必须快速的完成排序。从上述论述可 知,单纯的串行和并行排序都不能满足要求,只有本文这种基于FPGA技术的串并行结合处理排序算法才能够满足实际工程要求,达到了实时排序的效果。该算法 具有通用性,可以应用到各种数据快速排序运算领域。
无人机系统(Unmanned Aerial Systems, UAS)作为“低空经济”的核心载体,正以前所未有的深度和广度渗透至众多产业领域,驱动效率变革与模式创新。其核心价值在于提供高灵活性、低成本和高精度的空中解决方案,显著提升了传统作业方式的效能。
市场研究权威机构Omdia最新报告揭示,智能手机显示技术格局已发生根本性转变。2025年第一季度,采用AMOLED面板的智能手机出货量在全球总市场中占比高达63%,较去年同期的57%实现大幅跨越,标志着AMOLED已成为无可争议的主流标准。与此同时,LCD面板的份额被压缩至37%,延续了长期的萎缩态势。
7月16日,第三届中国国际供应链促进博览会(链博会)在京开幕。美国科技企业英伟达公司首席执行官黄仁勋身着唐装亮相开幕式,并在现场透露重要业务进展:该公司专为中国市场设计的H20人工智能芯片已获得美国商务部出口许可,即将启动批量供货。
近日,楷登电子(Cadence Design Systems, Inc., NASDAQ: CDNS)宣布其业界领先的LPDDR6/5X内存IP系统解决方案已成功完成流片验证。该集成化子系统通过技术优化,实现了高达14.4Gbps的运行速率,相较上一代LPDDR标准内存接口,性能提升幅度达到50%。此套先进解决方案被视为扩展人工智能(AI)基础架构的关键驱动技术之一。它旨在满足日益增长的新一代AI大语言模型(LLM)、代理型AI(Agent AI)以及众多垂直应用领域对超高内存带宽和容量的迫切需求,以高效支持这些计算密集型工作负载。楷登电子当前已与AI、高性能计算(HPC)及数据中心领域的多家头部客户展开紧密合作,共同推进该技术的应用落地。
作为全球授权电子元器件代理商,贸泽电子(Mouser Electronics)持续深化与德州仪器(TI)的战略合作,确保69,000余款TI器件的高效供应,其中45,000余款保持常态库存,可实现全球快速交付。通过整合TI在电源管理、数据处理及控制系统的完整技术生态,贸泽为工业自动化、汽车电子、通信基建、企业级设备等核心领域提供端到端解决方案支持。