发布时间:2015-11-17 阅读量:1100 来源: 我爱方案网 作者:
语音合成的最大特点就是要从有限的存储单元中合成出无限字汇的连续语句来。为了做到这一点,本系统设计了由:
(1)前端预处理模块将输入文本文件转换成系统可以处理的标准格式;
(2)韵律规则库给出当前语言环境下各个音节的韵律特征参数;
(3)语音合成器根据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整;
(4)将经过调整的各个语音单元拼接在一起,得到相应于输入文本的连续语音输出等4个基本流程组成。
系统基本原理框图如图1所示。
图1:系统基本原理框图
2 硬件系统设计
*基金项目:湖南省教育厅(03C025)
该中文语音合成系统的目的是对输入的文本文件能够清晰地、自然地、能懂地以连续语音地形式输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行 显示,再送TMS320VC5402处理,最后将合成结果输出。硬件结构框图如图2所示。
图2:硬件系统结构框图
2.1 键盘电路和显示电路
AT89S52的键盘接口电路是采用中断方式的,有键按下时,就产生中断请求,进入中断处理,然后通过查询P1.0和P1.1的情况,进行相应的处理。用电阻和电容够成了消抖电路,以防止电路的误操作。
AT89S52把从键盘输入的文本信息送给LCD显示,同时把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格式如表1所示:
表1 :LCD的指令格式
其中RS, R/W共同决定选择哪一个寄存器,如表2所示:
表2: 寄存器选择
2.2 TMS320VC5402与AT89S52的通信
AT89S52和TMS320VC5402各自独立工作,其信息和数据交换通过共享一片外部存储器来实现,它们之间信号联络通过硬连接和软件判断来实现。
外部存储器采用的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速度为25ns。它有两套独立的地址线、数据线和控制信号线,允许两个控制器件中的数据通过共同连接的存储器来进行通信。该双端口RAM允许两个控制器同时读取任何存储单元(包括同时读同一单元),但不允许同时写或者一读一写统一地址单元。
对于TMS320VC5402,数据存储器CY7C133的对应地址为4000H~47FFH。
对于AT89S52,数据存储器CY7C133的对应地址为2000H~27FFH。
3 软件系统设计
汉语作为一种有调语言,其韵律特征非常复杂。为了从有限的存储单元中合成出无限字汇的连续语句来,必须在一定的韵律规则下对语音库单元的韵律参数进行调整,以得到符合当前语流环境的音变单元[3]。
根据得到音变单元的方法不同,可将语音合成器分成两种类型:(1)波形拼接合成;(2)参数合成(又称源/滤波器合成)。本系统采用波形拼接合成的方法直接对波形的时域和频域波形进行调整以得到所需要的音变单元。
简单的波形拼接法很难进行音高和音长(时间长度)调整。因此,本系统采用中性语调音节直接拼接配合基音同步波形叠加(PSOLA)算法,并用码激励线性预测(CELP)编码方法对原始采样音库进行编码压缩的方法。基本流程图如图3所示。
图3:系统基本流程图
4 结束语
本系统利用SCM实时显示输入的文本文件,能够将合成语音和输入文本文件实现对比输出,直观性强;合成算法运算复杂度低,能够用尽量小的音库来实现对容量有限的存储空间的占用程度的要求具有清晰度、能懂度和自然度高。
行驶车辆检测器设计方案
基于LabVIEW的车辆监测系统设计方案
动力电池管理系统保护设计方案
基于无线传感网技术的智能停车系统设计
数据中心节能改造的七种解决方案
德国汽车零部件巨头博世集团于7月22日(周二)宣布,将在其位于德国南部的工厂实施裁员计划,涉及约1100个岗位,占该工厂员工总数的10%。此次调整主要影响装配线与后勤职能部门员工,被视为公司应对欧洲转向系统市场结构性挑战的关键举措。
2025年7月22日,TCL电子(01070.HK)发布盈喜公告,预计上半年经调整归母净利润达9.5亿至10.8亿港元,较2024年同期大幅提升45%-65%。在全球消费电子行业波动背景下,公司凭借技术升级与供应链优化实现逆势突围,经营韧性凸显业绩成长动能。
微软公司于近日结束2024财年后,对全球销售团队启动专项薪酬补偿计划。根据内部文件显示,在本财年因"系统性挑战或不可控财务因素"导致业绩未达标的销售人员,将获得基于更高配额完成比例的额外奖金。此举被视为稳定核心团队的重要措施。
OpenAI与甲骨文(Oracle)近日宣布扩大战略合作,计划在美国新增总容量达4.5吉瓦的数据中心集群,以支撑下一代人工智能系统的训练与部署。此次扩容将使双方联合运营的算力基础设施总量突破5吉瓦,预计部署超过200万颗专用AI芯片,成为全球规模最大的AI计算平台之一。
全球模拟芯片龙头企业德州仪器(TI)于7月22日发布最新季度财报,尽管第二季度营收达44.5亿美元(超出市场预期),但公司对第三季度的保守预测引发投资者担忧。财报显示,德州仪器预计第三季度每股收益区间为1.36-1.60美元(中值1.48美元低于分析师预估的1.52美元),营收指引44.5亿至48亿美元(中间值亦低于市场预期的46.2亿美元)。受此影响,公司股价在盘后交易时段大幅下挫11.4%,创年内最大单日跌幅。