手机端
or

欢迎您加入我爱方案网QQ群

1.智能产品外包服务群(311606115)
2.嵌入式项目开发群(491609563)

基于AMBE-2000的语音系统设计方案

我爱方案网| AMBE-2000,语音系统| 2012-02-03
794 收藏
分享到: 

每日精选

热门文章

专题报道
热门方案

中心议题:
    *  语音系统介绍
    *  AMBE-2000的功能与特点
    *  AMBE-2000与A/D-D/A芯片的接口设计
    *  AMBE-2000与信道的接口设计
    *  语音系统的外围接口设计
解决方案:
    *  该话音系统结构采用6U CPCI标准板卡
    *  该话音系统采用半双工工作方式

语音信号处理是现代通信中不可或缺的组成部分,随着对通信质量要求的越来越高,我们需要用尽可能低的数码率来获得尽可能好的合成语音质量。从市场现状来看,低速语音的应用市场很广泛:语音系统,数字移动通信,保密通信,语音邮件,可视电话,IP电话,语音存储,电话会议,电话购物等很多场合都需要用到。

AMBE-2000是DVSI(Digital Voice System Inc.)公司推出的单片声码器芯片。该芯片采用改进的多带激励(MBE)算法,能实现可变速率低比特率、高语音音质的语音压缩编码。本文基于AMBE-2000,设计并实现了一种基于AMBE-2000的语音系统。该系统具有设计简便、语音编码速率可变、音质优、接口灵活、工作电压低、功耗小等诸多优点,可广泛应用于卫星通信、短波、微波通信和保密通信等场合,具有很高的实用价值。

1 系统介绍

本语音系统的主要作用是实现数字话音与模拟话音的相互转换并处理话音数据的编解码,降低话音数据的传输速率,提高系统的频率资源利用率,此外须满足信息系统的接口要求。模拟话音部分连接耳机话筒组,数字部分压缩数据流连接外部处理器,解压数据流用于远距离传输语音量化信息。整个语音系统的原理框图见图1。

发送话音时  话音处理板将送入的模拟话音进行A/D采样量化后,经语音编解码芯片压缩打包通过CPCI总线或LVDS串行总线送入到信息处理器进行后续处理;或者通过高速RS 422串口将远距离传输来的语音量化信息经压缩后分别通过CPCI总线或者LVDS串行总线送往信息处理器进行后续处理。

接收话音时  通过CPCI总线或者LVDS串行总线收到压缩数据,经语音编解码芯片解码后通过D/A转换将话音转换为模拟信号;或者将收到的压缩数据,经解压后通过高速RS 422串口远距离传出去。

2 AMBE-2000的功能与特点

AMBE-2000芯片是AMBE-1000的改进产品。与AMBE-1000相比,其语音压缩算法更优化,语音质量更高,最低编码速率也由原来的2.4kbps降低到2.0kbps;在硬件和接口方面,也作了若干改进,并提高了其压缩编码和前向纠错编码(FEC)的效率和可靠性。AMBE-2000主要具有以下一些特点:

(1)速率多,语音音质高:具有2.0k、2.4k、3.6k、4.0k、4.8k、6.4k、8.0k和9.6kbps八种压缩速率。当速率在4.0kbps以上时,可得到接近长途电话的话音质量;当速率为2.0kbps时,仍然具有较高的可懂度和自然度。

(2)可变速的FEC功能:可根据信道情况,灵活地选择FEC的速率。语音和FEC的速率选择既可以通过硬件管脚设置,也可通过软件方式设置。

(3)芯片内集成卷积编码器和Viterbi译码器。

(4)低功耗、低复杂度。
 

 


(5)能产生和识别双音多频(DTMF)信号。

(6)具有语音激活检测(Voice Activity Detection)功能、回波抵消(Echo Cancelling)功能和舒适噪声(Comfortable Noise)产生功能等。

(7)串行信道接口可设置为主动和被动方式,传输数据可设置成帧结构或非帧结构。

在简易模型中,AMBE-2000被看作两个分离原件,编码器和解码器。编码器接收语音量化信息并以所期望的速率将压缩数据流输出信道。相反地,解码器接收信道压缩数据流,合成语音量化信息。对AMBE-2000编/解码器接口的时间控制是完全异步的。通常语音接口所接的是A/D、D/A芯片。输入输出语音数据流必须是相同的。格式(16-bit线性、8-bit A律,或8-bitμ律)。本系统采用AMBE-2000并且A/D-D/A芯片采用16-bit线性采样的AD73311就是为了与原先设计的一套基于AMBE-1000的话音系统保持兼容性。基于AMBE-1000旧式语音系统使用了体积过大,功耗较高的16-bit线性的A/D、D/A芯片TI32044,并且采用了一系列同样缺点的外围芯片,不适用于低功耗,小体积的发展趋势。

3 AMBE-2000与A/D-D/A芯片的接口设计

A/D-D/A芯片与AMBE-2000之间的语音数据流格式应当是匹配的,即要有统一的格式(16-bit线性、8-bit A律,或8-bμ律),一般情况下,建议选用16位线性元件。在本设计中,选用的是AD公司的AD73311.可以通过配置硬件管脚84,85(CODEC_SEL[1-0]=01b),将AMBE-2000的语音接口设置成专门与AD73311通信。所以AMBE-2000和AD73311配合使用会使得电路设计比较简单。

AD73311主要特点:

(1)低功耗的16位A/D-D/A转换器,输入/输出采样率和增益皆可通过软件控制,在话带范围内可提供70 dB的信噪比。通过串口传递语音数据,接收控制命令,简单高效。

(2)输入的模拟音频信号经过可变增益放大器,A/D转换器后转换为数字信号,通过串口输出;反之来自串口的数字流被转换为模拟信号后,经过可变增益放大器后输出。

(3)AD73311的主要工作模式有两种:编程模式和数据模式。芯片复位之后处于默认的编程模式,这时可以通过串口往控制寄存器写控制字,来设定工作状态。这里需要注意的是AD73311在3 V低功耗状态下(如图2所示)配置字应置为相应格式。


(4)上电复位后,AMBE-2000的CODEC_TX_DATA信号应与AD73311的串行输入隔离开,并保持365 ms左右,这时,利用FPGA配置AD73311,配置字如下:

设置完后,寄存器A写入Q1,表示进入"数据模式",AMBE-2000的CODEC_TX_DATA信号应与AD73311的串行输入接通,可以进行正常的数据传输。

4 AMBE-2000与信道的接口设计

AMBE-2000要求每20 ms编码器被控制器读取1次。复位后,初始帧准备好则EPR由高变低,之后每隔20 ms准备好1帧数据,相应地外部控制器也需要每隔20 ms读取1个数据帧。

EPR脉冲每20 ms出现1次,这也是判断AMBE-2000是否正常工作的重要依据。整个读取数据的过程为:
 

 


(1)等待小于20 ms的时间;

(2)发送帧同步信号,读取AMBE-2000一帧串行输出数据;

(3)如果接收到的数据不是0x13EC,说明不是数据帧头,丢弃这一帧并重新执行步骤、(2)。

(4)如栗接收蓟的数据是0x13EC,则读取本包的剩余23个字。

在该设计中,使用FPGA作外部控制器。FPGA产生输入/输出帧同步信号、输入/输出时钟信号以及AMBE-2000的串行输入数据,并按照AMBE-2000要求的时序关系与AMBE-2000进行数据交换。

表1列举了AMBE-2000的信道接口信号的特性,其与外部控制器的数据传输方式如图3,图4所示。


5 系统的外围接口设计

该系统的外围接口包括:CPCI接口电路;LVTTL与标准LVDS电平信号之间的转换电路;LVTTL与标准RS 422电平信号之间的转换电路;模拟电路。

5.1 CPCI接口电路

使用CPCI专用的桥接芯片可避开复杂的PCI协议,快速开发出产品。采用了PLX公司的高性能专用桥接芯片PCI9054实现CPCI接口设计。利用FPGA内部IP核生成双口并建立与CPCI部分的粘合逻辑,完成CPCI接口设计。

5.2 LVTTL与标准LVDS电平之间的转换电路

在本系统内除了标准CPCI总线形式实现数字部分压缩数据流与外部通信设备的数据交换外,还备用了LVDS串行总线方式传输,要求传输速率可达100 Mb/s.该系统使用MAX9129和MAX9122总线低压差分信号驱动器作为LVTTL与标准LVDS电平信号转换电路的驱动器。

5.3 LVTTL与标准RS 422电平之间的转换电路

解压缩后的语音数据流与外部数字音频设备数据交换以标准RS 422串行总线方式传输,要求传输速率可达5 Mb/s.本系统用MAX3491低功耗RS 485/RS 422收发器作为LVTTL与标准RS 422电平信号转换电路的驱动器,用于进行较远距离的数据传输。MAX3491每一个芯片内包含1个驱动器和1个接收器,最高传输速率可达10 Mb/s.

5.4 模拟电路

模拟放大电路包括运放及一些组容器件。主要作用是采用高性能低噪声的放大器,通过电位器或适当的比例电阻来调整输入/输出语音信号的增益。

该设计的音频接口电路采用有源平衡式输入/输出语音传输方式,这种方式起到了差模放大,共模抑制的作用,提高了抗干扰能力。在音频制作的初期,人们经常使用变压器用于校正不同设备间的接地电位差并取消电缆线路中产生的电噪声。它还可以将内部具有不平衡高阻抗特性的有源设备和具有较低阻抗特性的平衡传输线相连接。但变压器提高了成本,增加了系统重量,变压器有时还会带来系统失真。因此,设计者不断寻求去掉变压器的方法,结果就找到了有源平衡式输入/输出电路。

6 结语

该话音系统结构采用6U CPCI标准板卡,半双工工作方式,在300-3400Hz的话音带宽内,经测试话音字可懂度大于等于90%,语音句可懂度达100%,语调自然,发音清晰,是一款高质量的语音系统。

点赞

文章评论

登录后参与评论

深圳市中电网络技术有限公司 Copyright© www.52solution.com 粤ICP备10202284号