基于DSP的中文语音合成系统设计方案

发布时间:2015-11-17 阅读量:1079 来源: 我爱方案网 作者:

【导读】DSP芯片,即数字信号处理器,是专门为快速实现各种信号处理算法而设计的、具有特殊结构的微处理器,其处理速度比最快的CPU还快10~50 倍。本文将介绍一种基于DSP的中文语音合成系统实现方法。 
 
1 系统总体方案

 

语音合成的最大特点就是要从有限的存储单元中合成出无限字汇的连续语句来。为了做到这一点,本系统设计了由:

(1)前端预处理模块将输入文本文件转换成系统可以处理的标准格式;
(2)韵律规则库给出当前语言环境下各个音节的韵律特征参数;
(3)语音合成器根据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整;
(4)将经过调整的各个语音单元拼接在一起,得到相应于输入文本的连续语音输出等4个基本流程组成。

系统基本原理框图如图1所示。
 

图1:系统基本原理框图

2 硬件系统设计

*基金项目:湖南省教育厅(03C025)

该中文语音合成系统的目的是对输入的文本文件能够清晰地、自然地、能懂地以连续语音地形式输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行 显示,再送TMS320VC5402处理,最后将合成结果输出。硬件结构框图如图2所示。

图2:硬件系统结构框图

2.1 键盘电路和显示电路

AT89S52的键盘接口电路是采用中断方式的,有键按下时,就产生中断请求,进入中断处理,然后通过查询P1.0和P1.1的情况,进行相应的处理。用电阻和电容够成了消抖电路,以防止电路的误操作。

AT89S52把从键盘输入的文本信息送给LCD显示,同时把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格式如表1所示:


表1 :LCD的指令格式


其中RS, R/W共同决定选择哪一个寄存器,如表2所示:

表2: 寄存器选择

2.2 TMS320VC5402与AT89S52的通信

AT89S52和TMS320VC5402各自独立工作,其信息和数据交换通过共享一片外部存储器来实现,它们之间信号联络通过硬连接和软件判断来实现。

外部存储器采用的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速度为25ns。它有两套独立的地址线、数据线和控制信号线,允许两个控制器件中的数据通过共同连接的存储器来进行通信。该双端口RAM允许两个控制器同时读取任何存储单元(包括同时读同一单元),但不允许同时写或者一读一写统一地址单元。

对于TMS320VC5402,数据存储器CY7C133的对应地址为4000H~47FFH。

对于AT89S52,数据存储器CY7C133的对应地址为2000H~27FFH。

3 软件系统设计

汉语作为一种有调语言,其韵律特征非常复杂。为了从有限的存储单元中合成出无限字汇的连续语句来,必须在一定的韵律规则下对语音库单元的韵律参数进行调整,以得到符合当前语流环境的音变单元[3]。

根据得到音变单元的方法不同,可将语音合成器分成两种类型:(1)波形拼接合成;(2)参数合成(又称源/滤波器合成)。本系统采用波形拼接合成的方法直接对波形的时域和频域波形进行调整以得到所需要的音变单元。

简单的波形拼接法很难进行音高和音长(时间长度)调整。因此,本系统采用中性语调音节直接拼接配合基音同步波形叠加(PSOLA)算法,并用码激励线性预测(CELP)编码方法对原始采样音库进行编码压缩的方法。基本流程图如图3所示。
 

图3:系统基本流程图

4 结束语

本系统利用SCM实时显示输入的文本文件,能够将合成语音和输入文本文件实现对比输出,直观性强;合成算法运算复杂度低,能够用尽量小的音库来实现对容量有限的存储空间的占用程度的要求具有清晰度、能懂度和自然度高。


推荐阅读:

 

行驶车辆检测器设计方案
基于LabVIEW的车辆监测系统设计方案
动力电池管理系统保护设计方案
基于无线传感网技术的智能停车系统设计
数据中心节能改造的七种解决方案

相关资讯
从T41到T33V,解密君正三大代系AOV芯片的突围之路

Always on Video(AOV)技术是安防行业近年来的重大突破,它基于超低功耗内存的快速启动待机技术,实现设备7×24小时全天候录像,彻底解决传统低功耗方案在事件触发间隙无录像信息的行业痛点。北京君正作为国内同时掌握CPU、VPU、ISP、AIE等核心技术的创新企业,率先在T41系列芯片上实现AOV技术商用落地,并持续迭代出T32V/T33V系列方案,构建起覆盖低、中、高三档的全方位产品布局。

2025年全球半导体市场持续增长,AI与先进电子需求成关键驱动力

美国半导体行业协会(SIA)最新数据显示,2025年4月全球半导体销售额达到570亿美元,较3月的556亿美元增长2.5%,同比2024年4月的464亿美元大幅增长22.7%。这一增长标志着2025年全球半导体市场首次实现环比正增长,展现出行业复苏的积极信号。

昂瑞微OM6629系列蓝牙SoC芯片:重新定义低功耗无线连接

随着物联网(IoT)、智能家居、工业互联等领域的快速发展,低功耗蓝牙(BLE)技术成为短距离无线通信的关键支柱。北京昂瑞微电子技术股份有限公司(昂瑞微)在2025蓝牙亚洲大会上正式发布了OM6629系列新一代低功耗蓝牙射频SoC芯片,该芯片在功耗、性能、安全性和兼容性等方面实现全面升级,为智能穿戴、医疗监测、工业控制、消费电子等应用提供更高效的无线连接方案。

2024年全球平板显示器市场深度报告:电视、平板与汽车驱动增长新周期

据Counterpoint Research最新研究显示,2024年全球平板显示器市场收入预计同比增长11%,扭转近年低迷态势。这一增长主要由电视、平板电脑及新兴车载显示三大品类拉动,其中电视面板贡献率达19%,成为核心引擎。行业分析指出,技术迭代与应用场景拓宽正推动市场进入结构性增长新阶段。

英伟达中国特供芯片B40加速推进,供应链厂商中金科宣布扩产备战

近日,中金科工业(ZJK Industrial Co., Ltd.)宣布将扩大产能,以满足英伟达专为中国市场定制的AI加速芯片B40的预期需求。该芯片基于英伟达最新的Blackwell架构,定位中高端市场,预计2025年6月进入量产阶段。