嵌入式微处理器IP core的改进设计方案

发布时间:2011-12-28 阅读量:1336 来源: 我爱方案网 作者:

中心议题:
    *  总体设计方案的拟定
    *  各子模块的设计
    *  系统综合、仿真验证与性能分析
解决方案:
    *  将乘、除法单元各自独立出来
    *  采用类RISC的指令系统和硬布线直接产生控制信号的方式
    *  尽量减少指令执行所需的时钟周期
    *  采用标准的自顶向下的设计方法
  
在嵌入式系统的设计中, IP技术为SoC的设计提供了有效途径, 是SoC的技术支撑。当然, 在国内开发出具有自主知识产权的IP模块还面临着许多问题, 如核心算法的优化、不同层次模块的建立、模块的可重用问题以及IP模块的标准化问题等。对于嵌入式处理器IP 核, 面对的挑战就是如何选择一个满足其应用需求的处理器。现已有数百种嵌入式处理器, 每组都具备一组不同的外设、存储器、接口和性能特性, 用户很难做出一个合理的选择。本文设计的微处理器的指令集与标准8051单片机完全兼容, 这样有利于开发人员的使用。
  
1 总体设计方案的拟定
  
1.1 提出改进方案
  
首先在对典型八位微处理器进行了详尽地剖析的基础上, 指出在传统典型微处理器内核中制约微处理器整体性能的主要因素, 然后提出以下改进方案:
  
(1) 微处理器的内核结构上, 将乘、除法单元各自独立出来来完成算术逻辑指令中的乘、除法运算。这样可以回避传统典型微处理器基于累加器的ALU结构及算术逻辑指令, 从而提高逻辑指令的执行效率。
  
(2) 在指令系统上, 通过采用类RISC的指令系统和硬布线直接产生控制信号的方式来简化指令译码器的设计。同时为内核添加指令缓冲区、采用指令流水线技术、多管道并行执行指令。
  
(3) 指令时序上, 设计中尽量减少指令执行所需的时钟周期, 提高微处理器的运行效率。
  
1.2 总体设计思路
  
根据IP core通用的设计方法, 本文采用了标准的自顶向下的设计方法。就是根据系统级的内容,把系统划分为单元, 然后再把每个单元划分为下一层次的单元, 这样一直划分下去, 直到最底层的单元可以用硬件描述语言进行设计, 如图1所示; 接着在完成各个模块设计的基础上完成系统级设计;然后进行整个系统的仿真验证; 最后选用特定的FPGA芯片进行综合、布局布线以及功能后仿真。

图1 微处理器系统级划分图

 

 


  
2 各子模块的设计
  
2.1 ALU模块
  
算术逻辑单元(ALU) 是微控制器的核心部件, ALU的设计依赖于指令系统, ALU采用什么样的结构、设置那些功能都是建立在对系统指令集分析的基础上来完成。
  
根据算术运算类指令可知, ALU单元主要要完成的功能有: 带/不带进位加/减法、乘法、除法、十进制调整、逻辑运算以及布尔操作的实现。整个操作的完成是通过多路选择器控制来完成。因此, 我们可以对整个ALU系统进行如图2划分, 然后对各个子模块进行设计。

图2 ALU系统划分框图
  
2.2 控制通路的设计
  
本文中的控制通路由译码器模块和控制器模块两部分组成。这部分的设计是在对指令系统进行正确分析的基础上来完成。
  
设计控制通路有两种主要的方法。微程序控制(或微序列控制) 方式使用存储器查表方式来输出控制信号, 而硬连线控制使用时序逻辑和组合逻辑来产生控制信号。硬件直接实现的控制单元一般用有限状态机实现, 通常有较高的运算速度;但是通用性差, 每个电路都必须专门设计控制单元。每一种方法都有一些变形形式。由于本文中微处理器的控制相对简单, 所以在设计中采用了硬连线控制方法。

(1) 控制器模块的状态机实现
  
根据本文中多数输出要保持一个完整的时钟周期, 此时钟周期内输出不能受时钟信号的影响,所以采用Moore型有限状态机来完成控制器模块的设计。整个控制模块的设计通过主状态机和子状态机两步来完成。注状态机模型如图3所示。

图3 控制单元的主状态机模型
  
以中断处理子状态机设计为例, 对子状态机的设计进行说明, 状态转换图如图4所示。

图4 中断处理状态机状态转换图

 

 


  
(2) 存储器模块的设计
  
存储器是数字系统的重要组成部分, 数据处理单元的处理结果需要存储, 许多处理单元的初始化数据也需要存放在存储器中。本文的存储器结构, 采用的是将程序存储器和数据存储器分开寻址的哈佛结构。同时又将数据存储器分为内部数据存储器和外部数据存储器两部分来设计。
  
(3) 中断系统设计
  
本文中的中断系统在控制通路来完成, 共提供了5个中断源, 同时通过对中断优先级寄存器IP中的某位的置位或清除, 可以把每个中断源分别编程为高优先级或低优先级。如表1所示。

表1 中断源表

  
(4) 定时器/计数器模块的设计
  
定时器/计数器是微处理器中重要的外围模块,它主要是完成作为定时器和事件计数器的功能。
  
在作为定时器工作时, 每一个机器周期使定时寄存器加1计数。在作为事件计数器工作时, 是对外部输入负跳变信号做加法计数, 规定在每个机器周期的某一状态采样此信号, 在前一个周期采样到"1", 后一个周期采样到"0" 时计数加1, 而在检测到跳变信号后的那个周期的下一个状态时,新的计数值装入计数寄存器。
  
3 系统综合、仿真验证与性能分析
  
在整个微处理器IP核的设计过程中, 利用可编程逻辑器件进行电路验证对于保证设计的正确性和投片成功十分重要。在FPGA的设计流程中包括三种基本的验证方法: HDL、RTL级描述仿真, 门级仿真和布线后的时序仿真。具体验证流程如图5所示。仿真的目的就是要确认设计的正确性。如果出错的话, 则通过分析仿真器的输出波形, 找出出错的原因, 并对原设计进行修改。

图5 系统验证流图

3.1 仿真验证
  
验证方法: 首先编写各种测试代码; 然后转化为vhdl文件, 再写入ROM模块; 最后在仿真环境中运行IP核, 完成对整个系统的全指令集测试。一般内部RAM和寄存器的值无法直接检测, 可以通过多条指令将其输出到IP核的四个输出端口供检查。本文采用Model Tech公司的仿真工具Moledsim来进行功能仿真和时序仿真。
  
图6是对基本子程序调用指令的测试仿真时序。包括子程序调用、传送、加法以及返回等指令。根据测试指令集, 如果程序执行正确, 那么在程序执行完后, 输出端口P0口就会出现21H。

 

 




图6 基本子程序调用指令的测试仿真波形图
  
测试指令集: MOV A, #20H; ACALL DELEY;MOV P0, A; DELAY: INC A; MOV P0, A。
  
3.2 综合及综合结果分析
  
本文中的综合及优化都是由综合工具SynplifyPro来完成的。利用Synplify Pro工具提供的逻辑综合与适配工具和设计的约束条件, 可以方便的实现本文各模块的逻辑综合和布局布线。
  
对于本文中的八位微处理器来说, 由于它是一个非常复杂的数字逻辑电路, 不仅包含大量的组合逻辑电路, 而且包含了时序复杂的时序逻辑电路。通过逻辑综合估计整个系统超过一百万门,因此要用大容量的可编程逻辑器件来做电路验证。
  
通过比较各种可编程逻辑器件的性能和结构特点(见表2), 决定采用器件Xilinx Virtex2 XC2V1000bg575-6来完成本文的电路验证。

表2 Virtex2系列器件性能和结构特点表

  
综合结果分析主要是利用结构视图、综合报告分析综合结果是否满足时序要求, 分析综合的频率、面积等信息。
  
3.3 性能分析
  
本文的器件资源的占用情况如表3.(由于内部存储器要占用很多的资源, 故此表列出的是缩减内部内存后器件的资源占用情况)。

表3 器件资源占用情况表
  
将经过FPGA验证的MCU核与传统的微处理器做比较, 可以看出, 由于所设计的微处理器核是采用硬布线逻辑产生控制信号, 所以其工作时钟频率要大大优于传统的微处理器。FPGA验证的结果是, 工作时钟频率大于60MHz, 是传统微控制器工作时钟频率的五倍; 在每MHz时钟频率的指令执行效率指标上, 所设计微处理器核的性能约为传统微控制器的12倍。这得益于微控制器内核采用类RISC指令结构, 及设计指令执行周期的大大减小。
  
4 结束语
  
由于整个微控制器内核都是采用可综合的VHDL语言描述, 这使得该内核具有很好的可移植性、可重复利用性和实用性。也可以适当地拓宽数据总线的宽度, 以减少内存访问的次数, 从而提高指令执行效率。此外, 还可借助EDA工具,方便地与AD/DA转换器、LCD显示驱动器、串行通信接口等外围功能模块综合成各种嵌入式控制系统。

相关资讯
村田BLM15VM系列量产在即:车规级磁珠解决高频通信干扰难题

在智能驾驶飞速发展的时代,5.9GHz频段的C-V2X(蜂窝车联网)和5.8GHz频段的DSRC(专用短程通信)已成为车辆与环境交互的关键神经。然而,GHz频段内日趋复杂的电磁环境却为通信灵敏度与可靠性带来严峻挑战。传统噪声抑制元件在应对高频宽范围干扰时力不从心,高性能宽频噪声解决方案成为行业急需突破的技术瓶颈。村田制作所(Murata)以其深厚的材料技术积淀和创新设计,适时推出了革命性的片状铁氧体磁珠——BLM15VM系列,直击高频车联网通信的核心痛点。

微软战略转型:裁员重组与800亿美元AI投资的双轨并行

据彭博社6月20日报道,微软计划于今年7月启动大规模组织结构调整,预计裁员数千人,主要集中在全球销售与客户服务部门。此举引发行业对科技巨头战略重心迁移的高度关注,尤其引人瞩目的是其裁员节省的资金流向——微软官方确认将在新财年向人工智能基础设施领域投入约800亿美元。

Microchip新一代DSC破解高精度实时控制难题,赋能AI电源与电机系统

在AI服务器爆发式增长、新能源系统复杂度飙升的产业背景下,传统控制芯片正面临三重挑战:碳化硅/氮化镓器件的高频开关控制需求、功能安全标准升级、以及机器学习边缘部署的实时性要求。Microchip最新推出的dsPIC33AK512MPS512与dsPIC33AK512MC510数字信号控制器(DSC),通过78ps PWM分辨率与40Msps ADC采样率的核心突破,为高精度实时控制树立了新基准。

全球扫地机器人市场迎开门红 中国品牌领跑优势持续扩大

根据权威机构IDC最新发布的《全球智能家居设备季度追踪报告》,2025年第一季度全球智能扫地机器人市场迎来强劲开局,总交付量达到509.6万台,较去年同期增长11.9%,连续第二个季度实现超过20%的增长率。市场活力显著提升,展现出强劲复苏势头。

汽车电子革新:TDK高集成PoC电感破解ADAS空间与成本困局

随着ADAS渗透率突破50%(据Yole 2023数据),车载传感器供电与数据传输架构面临革命性变革。传统双线分立设计(电源线+信号线)导致线束占整车重量超3%,且故障率居高不下。TDK株式会社推出的ADL8030VA系列PoC专用电感器,通过单元件高集成方案重构滤波电路,为智能驾驶系统提供空间与可靠性双重优化路径。