【珍藏资料】语音识别四大平台,九大芯片原厂及方案

发布时间:2016-11-28 阅读量:4463 来源: 发布人:

日前,科大讯飞和我爱方案网、快包联合推出的“握手AI,共创共享——2016讯飞智能语音设计大赛”正在火热报名中!虽然智能语音在智能家居、车载、可穿戴这杯方面的普及度并不高,但在手机、平板上面,相信大家都体验过它的便捷。讯飞输入法就是小编最爱的输入法,没有之一。讯飞输入法语音识别迅速且准确率高,还有离线识别功能,非常好用。



“握手AI,共创共享--2016讯飞智能语音设计大赛”报名入口  >>>


提到智能语音,不得不了解语音识别芯片。语音识别芯片也叫语音识别IC,与传统的语音芯片相比,语音识别芯片最大的特点就是能够语音识别,它能让机器听懂人类的语音,并且可以根据命令执行各种动作,如眨眼睛、动嘴巴(智能娃娃)。除此之外,语音识别芯片还具有高品质、高压缩率录音放音功能,可实现人机对话。语音识别芯片所涉及的技术包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。方案超市为大家梳理一下智能语音的四大平台以及在这个领域深耕细作的芯片商与方案公司。让大家对这个行业有更全面详细的了解。


一、语音识别分类

按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。

特定人语音识别芯片是针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练2遍语音词条即可使用。

非特定人语音识别是不用针对指定的人的识别技术,不分年龄、性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集200人左右的声音样本,经过PC算法处理得到交互词条的语音模型和特征数据库,然后烧录到芯片上。应用这种芯片的机器(智能娃娃、电子宠物、儿童电脑)就具有交互功能了。
非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本就可以做交互识别,但是缺点是识别率不高,识别性能不稳定。

二、语音识别基本原理

嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统"学习"或"训练"阶段,这一阶段的任务是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复发音多遍,再经特征提取和某种训练中得到。第二是"识别"或"测试"阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。(相关阅读:详解麦克风阵列技术及智能语音设备方案选型)


三、语音识别的应用场景

1、智能语音车载
曾经看过一款汽车的概念宣传广告,驾驶员通过语音指令找到自己的车;打开车锁,通过语音指令寻找导航,播放音乐等等,相当炫酷。当然对于智能车载来说更关键的是行车安全问题,对于驾驶员来说,能通过语音控制接打电话,查看自己的社交软件,绝对比在开车的过程中手忙脚乱的用手控制来的更安全。

2、智能语音家居
现在的智能家居市场之所以外热内冷,智能家居产品之所以不受消费者待见,一个非常主要的原因是现在的智能家居产品没有抓住消费者的痛点,将原本简单的事情复杂化了。在手机上找到控制app打开窗帘的过程远比消费者直接走到窗前拉开窗帘来的麻烦。而有了语音识别的智能家居则不一样,消费者只要轻轻说声“开窗帘”就能打开窗帘。

3、智能语音医疗应用
前一段时间,著名语音识别企业Nuance 在其官方博客上,公布了将发力医疗领域的消息。其产品不但能通过智能手表追踪人体运动情况和心率,还可以根据人的身体状况匹配相应的服务,如合适的餐厅或食物等。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。

4、智能穿戴语音控制
我们总有那么些时间是没法使用自己的双手的。打电话,发微信,查路线,叫车,这些如果都可以用一个可穿戴设备通过语音控制实现,那该多好!

语音识别的场景非常广阔,参加2016讯飞智能语音大赛,挑战不可能!


四、语音识别四大平台

1、科大讯飞(http://www.iflytek.com/)


科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。11月23日科大讯飞轮值总裁胡郁在发布会上引述了罗永浩在 9 月锤子发布会上的演示数据,表示科大讯飞的语音输入识别成功率也达到了97%,即使是离线识别准确率也达到了95%。

2、云知声(http://www.unisound.com/)

云知声成立于2012年6月。之前1年,Siri的发布再度唤醒了大家对语音识别的关注。经过四年多的积累,云知声的合作伙伴数量超过2万家,覆盖用户超过1.8亿,其中语音云平台覆盖城市超过470个,覆盖设备超过9000万台。

3、百度(http://yuyin.baidu.com/)


百度则在11月22日宣布向开发者开放了情感合成、远场方案、唤醒二期和长语音方案等四项语音识别技术。百度语音开放平台自 2013 年 10 月上线以来每日在线语音识别请求已经达到了1.4 亿次,开发者数量超过 14 万。在如此庞大的数据支撑下,百度语音在“安静条件下”的识别准确率达到了 97%。

4、搜狗


搜狗语音团队在 11 月 21 日推出了自己的语音实时翻译技术。搜狗的这项技术主要包括两个方面,分别是语音识别和机器翻译。根据该团队的介绍,搜狗语音识别的准确率达到了 97%,支持最快 400 字每秒的听写。

五、语音识别芯片原厂及芯片方案

1、ICRoute


总部:上海
简介:ICRoute专注于开拓语音识别的芯片市场,致力于研发出高性能的语音识别,语音处理芯片。为各种平台的电子产品提供VUI(Voice User Interface)语音人机交互界面。目前提供的语音识别芯片,可以在包括蓝牙,小家电,照明开关,玩具,车载电子,遥控器等各个电子产品领域提供非特定人的语音识别/声控功能。
官网:http://www.icroute.com/

语音识别芯片:ICRoute LD3320——能在单片机上使用的语音识别芯片

由LD3320组成的语音识别系统有很广泛的应用,如语音控制的点歌系统、语音控制的手机、音控智能导航仪、音控智能家电产品等。


LD3320评估板(其中,控制MCU选用的是STC的51单片机)


2、凌阳、凌通(芯片原厂)


总部:台湾
官网:http://w3.sunplus.com/

语音识别芯片:

凌阳单片机61A——带有语音识别芯片的微控制器,可以实现语音识别功能的芯片,一般小客户只能拿到特定人识别的参考代码。


3、新唐科技


总部:台湾
官网:http://www.nuvoton.com/

语音识别芯片:——ISD9160


ISD9160是一款具有Cortex-M0内核的语音SOC,能够实现录音放音等应用。通过软件支持,ISD9160可以实现特定人和非特定人语音识别。其中非特定人语音识别支持九种语音,方便客户开发国际化的产品。客户在开发的时候,使用新唐提供的ASR Tool工具,只需将所需命令写成文本模式,然后经由工具转换,就能生成用于项目文件的语音识别代码模块,简单并且容易使用。这种语音识别方案适用于语音控制系统领域,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如智能家电、智能穿戴、声控智能玩具等许多领域。

4、全志


总部:珠海
官网:http://www.allwinnertech.com/

全志R16助力科大讯飞智能语音

科大讯飞4+1环形五麦克风阵列搭载全志R16平台


搭载全志R16平台的科大讯飞4+1环形五麦克风阵列,专为机器人等可移动、能灵活转身、有全角度拾音需求的智能硬件产品而设计,远场拾音距离可达5米。相比以往线性麦克风单维180度的覆盖维度,它可将覆盖度扩大到二维空间,即360度全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强,就算在嘈杂的环境中也能准确地识别声音。卓越的环形五麦克风远场识别技术与语音识别、语音合成、语音唤醒、声纹识别、人脸识别等交互技术相结合,让智能硬件产品拥有了更出色的人机交互能力。


5、深圳市盛矽电子科技有限公司(二次开发)


总部:深圳
简介:盛矽电子是专业从事语音方案与技术服务的提供商,由深圳总公司和北京研发中心分公司组成。专注于语音识别、智能玩具、儿童电脑、语音芯片等领域。
官网:http://www.semxi.com/

语音识别芯片:


1)特定人语音识别·录音·放音语音芯片SR150X
特定人语音识别录音放音语音芯片SR150X,最大识别词条30句,可实现录音、放音、LED发光管输出及电机控制。SR150X特定人语音识别、录音、放音、LED、音乐、电机、控制机芯可增加产品的趣味性、娱乐性,广泛应用于智能毛绒玩具、智能娃娃、塑胶娃娃、礼品等行业。


2)非特定人OTP语音识别芯片SR170X
非特定人语音识别芯片SR170X系列,内有海量词库免采库,抗噪性极佳!独有的的软件虚拟机技术,只要硬件资源能够匹配,所有软件功能可以通过Flash端实现,有效降低客人MASK风险以及库存量,多款产品可以通过同一颗芯片实现,真正实现零库存,MASK的价格,OTP的性能。

6、深圳市捷通语音技术开发有限公司(二次开发)


总部:深圳
简介:深圳市捷通语音技术开发有限公司是一家专业从事语音识别、语音合成业务的科技及贸易一体化公司。公司开创了语音识别芯片应用在玩具领域的市场。公司可根据客户的需求,提供产品的解决方案; 为特定市场的产品,设计新功能新应用,为品牌企业实现产品创新。
官网:http://www.szjtvoice.com/

7、上海华镇电子科技有限公司


总部:上海
简介:上海华镇是专门从事语音识别、语音合成、声纹识别技术的开发、研究、软件应用及提供全程技术支持和服务的高新科技企业;全面掌握核心技术,其中中文语音识别和合成技术代表了当今世界同类产品的领先水平。其技术能够应用于各种电子及通信设备,包括:智能玩具,智能家居系统,智能汽车导航及声控,智能手机Smartphone、 PDA、固定电话、移动电话,电信级的服务器及个人电脑等。
官网:http://www.wanson.cn/

语音识别芯片/模块
1)语音识别芯片/模块GM11A550
2)高端语音识别芯片/模块WS117--最多支持1000条词条识别
3)特定人语音识别(SD)芯片WS-100

8、北京承芯卓越科技有限公司


总部:北京
简介:公司成立于2006年12月,是一家立足于中关村清华科技园区的北京市高新技术企业,海淀区创新企业,是以提供具有自主知识产权的智能语音处理类专用芯片和方案为主业的高科技公司。主要致力于自主研发嵌入式语音识别芯片、应用软件技术、和智能语音应用方案。
官网:http://www.helios-adsp.com.cn/

语音识别芯片:
1)语音识别芯片-28X
2)语音识别芯片-29X
3)语音识别协处理芯片-HBR34X


9、深圳唯创知音电子有限公司


总部:深圳
简介:专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的高新技术公司。杰出的语音芯片厂家,从事语音芯片研究及外围电路开发;同时为有特别需求的客户制订语音产品开发方案,并且落实执行该方案,完成产品的研发、测试,声音处理,直至产品的实际应用指导等一系列服务。业务范围涉及电话录音、汽车电子、多媒体、家居防盗、通信、家电、医疗器械、工业自动化控制、玩具及互动消费类产品等领。
官网:http://www.waytronic.cn/

语音识别芯片/模块:

WTK6900B01语音识别模块,该模块的详细信息请点击:http://www.52solution.com/index.php/Home/OneBuy/oneBuyDetail/id/4126.html



更多智能语音方案,欢迎进入方案超市>>>搜索

相关资讯
贸泽电子发布智能家居开发平台,集成Arduino/NXP/Qorvo创新方案

为加速智能家居的普及与创新,全球知名电子元器件分销商贸泽电子重磅推出全新的 “智能家居资源中心”。该中心汇聚海量精选技术资料,为工程师打造下一代自动化与互联解决方案提供强力支持。随着智能恒温器、冰箱等物联网设备深入家庭生活,用户对个性化体验、能源效率与安心安全的需求激增。工程师们正面临着融合如三频通讯、Matter协议等前沿技术以构建无缝智能生态系统的挑战。贸泽的资源中心正是为此而生,致力于简化设计流程,将未来互联家庭的愿景变为现实。

思特威突破车载视觉"卡脖子"难题:首颗全流程国产3MP CIS量产

在全球汽车产业加速迈向智能化、网联化的浪潮中,高可靠、高性能的车载图像感知系统扮演着至关重要的角色。环视摄像头作为感知车辆周边环境的“眼睛”,其性能直接关系到驾驶安全与辅助驾驶功能的体验。2025年7月,思特威(上海)电子科技股份有限公司(股票代码:688213)正式发布Automotive Sensor (AT) Series系列的重要成员——SC326AT。这不仅是一款3MP(300万像素)高性能车规级CMOS图像传感器新品,更是思特威车载系列中首款实现设计、制造到量产全流程国产化的里程碑式产品。它基于思特威自研的CarSens®-XR工艺平台打造,在核心成像性能、环境适应性及系统集成度上均实现显著突破,直指高端环视应用的痛点,为提升智能汽车感知系统的韧性与竞争力提供了强有力的国产化支撑。

苹果芯片版图再扩张!7款自研芯片曝光,深化垂直整合战略

根据近期知名开发者社区曝光的最新信息显示,苹果正在加速其芯片自研进程,计划推出至少7款尚未对外公开的全新芯片设计。这一雄心勃勃的计划涵盖了其核心终端产品线,包括应用于未来iPhone的A19系列、下一代Mac的M5系列、新款Apple Watch处理器、第二代5G调制解调器C2,以及一款具备突破性集成设计的通信芯片Proxima。多项证据表明,苹果正加速推进全产品线核心处理器代际更新,深化垂直整合优势。

轴向电阻SMD化!Vishay AC03-CS WSZ系列降本增效解决方案详解

在现代电子制造业,提升自动化装配效率与降低生产成本是企业持续追求的目标。通孔元件(THT)在贴装环节往往需要额外的插件工序,相较表面贴装元件(SMD)效率较低。针对这一行业痛点,全球领先的电子元件制造商威世科技(Vishay Intertechnology, Inc., NYSE: VSH)宣布其广受欢迎的AC03-CS系列轴向绕线安全电阻推出创新的WSZ引线版本选件。这一设计革新使得原本需要插件工艺的轴向电阻能够无缝融入标准的SMT(表面贴装技术)生产线,显著缩短装配周期并有效控制整体制造成本。本次升级为汽车电子、工业驱动及智能能源等领域的关键安全电路设计提供了兼具性能与成本效益的全新解决方案。

Meta豪掷2亿美元争抢AI顶尖人才,超级智能团队组建引发行业震动​

全球人工智能人才争夺战已进入白热化阶段。Meta公司近期以突破行业纪录的薪酬方案招募前苹果公司AI模型研发负责人庞如明(Ruoming Pang),据悉该方案总价值逾2亿美元,包含现金奖励与长期股权激励。此举标志着科技巨头对顶尖AI人才的投入达到前所未有的量级。