科大讯飞能称霸智能语音领域 这五大语音交互技术功不可没

发布时间:2016-11-19 阅读量:5019 来源: 发布人:

2016年11月17日,科大讯飞携最新成果参加了我爱方案网、快包与中国可穿戴计算产业技术创新联盟联合主办探索人工智能、医疗健康、虚拟现实之间的互动论坛,论坛由我爱方案网副总王勤女士主持。论坛上,科大讯飞产品总监王磊分享了智能人机交互服务,以及最新的AI/VR方案。他表示,科大讯飞的产品之所以领先业界,与以下五大关键技术的发展密不可分。



关键技术一:语音合成

语音合成技术主要是根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。王总介绍到,语音合成技术是在讯飞在2010年开发完成的,在这方面,讯飞目前的语音合成的自然度已经超过了普通人。



明星应用场景:讯飞主流的语音技术应用场景很多,比较具有代表性的便是现今网络爆红的高德地图语音导航系统与滴滴打车,高德运用讯飞开放平台的语音合成产品,明星真声合成的语音提示带来人性化的体验,使得高德地图下载量超过平日的6倍,新增用户速率提升230%,每日活跃用户增加36%。

关键技术二:语音识别

语音识别是一门交叉学科,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,科大讯飞的语音识别起步较晚,不过发展的很快,大概是在2014年真正落地。王总介绍到,目前科大讯飞的语音识别技术普通话识别准确率突破95%,并开放包括湖南话、粤语、闽南语等多达十八种方言。



明星应用场景:语音识别APP心声。“这种技术非常有意义,不仅方便日常文字—语音之间的转换,对于聋人群体来说也是一个福利,心声是一款语音识别APP,聋人只需要使用APP就可帮助自己去倾听别人说话,沟通会变得非常简单。”论坛上王总说到。

关键技术三:语义理解

语义理解是衡量人机交互的体验度的一个重要指标,人工智能的核心是认知,而认知的核心是语义理解技术。机器人只有在“懂”了人类的指令后,才能正确执行用户下达的指令。



明星应用场景:三宝机器人。它运用开放平台的语义理解、人脸检测、自主声源定位等技术,让三宝具有像人一样的“看”“听”“嗅”功能,全方位感知周边环境,让用户体验智能家居生活。

关键技术四:麦克风阵列

麦克风阵列,从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。这种技术能够使机器人或者被控制产品在嘈杂环境清楚的辨识真正的语音指令,在酒店、马路等公共场所有非常广泛的应用。



明星应用场景:康力优蓝U05优友机器人。该机器人运用开放平台五麦克风阵列及语音技术,是国内第一款可量产的大型服务机器人。

关键技术五:AIUI人工智能交互界面

王工认为,在万物互联时代,要真正实现流畅的人机交互,必须满足四点:第一是远场降噪;第二是方言识别;第三是全双工,随时随地在听;第四个自动纠错,主动纠错,支持多轮对话、打断、上下文相关。只有这些都具备,才是万物互联时代真正的人机语音交互系统。在这个基础上,科大讯飞以语音为主结合图像视觉及手写识别,将整个人工智能功能集结在一起,推出了业界首个人工智能的用户交互界面——AIUI。



明星应用场景:AIUI。在之前AIUI发布会现场,科大讯飞在全球首次将演讲人的演讲同步转写成文字在大屏幕显示,接受现场数千参会者和数千万观看视频直播观众的检验。王总强调,这个技术亦将是科大讯飞未来的发展方向。

同时,由我爱方案网与科大讯飞联合主办了一场智能硬件设计大赛于今天正式开启,本次活动旨在寻找人工智能领域最具创意的设计者。借力科大讯飞成熟的人工智能交互平台,应用以上五大语音技术,快速接入人工智能风口,寻找创新的种子并共同孵化出创新的解决方案推向市场,我们为最具创意的你准备了六万现金大奖以及科大讯飞十万的语音优质资源,帮助开发者实现业务创新落地,成就你创新梦想。



凡参与本次比赛的选手均可以获得以下福利:
1、获得科大讯飞实习或者工作的机会;
2、获得我爱方案网品牌宣传,优质资源优先对接的机会;
3、获得科大讯飞语音技术支持。而通过比赛筛选入围方案以及最佳方案均将获得科大讯飞价值十万语音优质资源,还有丰厚的现金大奖等着你!

目前,活动整在火热报名中,报名时间将持续到2016年12月18日。人工智能正在改变世界,开发奖金、创业风口、投资机会正在向你招手,准备好了就来挑战吧!

活动报名入口:http://www.52solution.com/index.php/Home/Special/kdxf

相关资讯
双面散热+5×6mm²封装:解密英飞凌如何实现IBC能效三级跳

随着AI算力需求呈指数级增长,全球超大规模数据中心对供电系统的能效与功率密度提出更高要求。英飞凌科技(FSE: IFX)最新发布的OptiMOS™ 6 80V功率MOSFET,通过5x6 mm²双面散热(DSC)封装技术,在中间总线转换器(IBC)应用中实现0.4%效率提升,单kW负载节省4.3 W功耗。据测算,部署该方案的2000机架数据中心每小时可节能1.2 MWh,相当于25辆小型电动车充电所需能量。

900GB/s突破!英伟达开放核心互连技术引发行业震动

在2024年台北国际电脑展(Computex 2024)主题演讲中,英伟达CEO黄仁勋宣布将向全球芯片设计企业开放其核心互连技术——第四代NVLink Fusion。该技术旨在突破传统芯片间通信瓶颈,为构建下一代AI算力集群提供标准化解决方案

多协议并发+超低功耗!Qorvo QPG6200系列重塑物联网连接标准

全球连接与电源解决方案领导厂商Qorvo®(纳斯达克代码:QRVO)近日宣布,其QPG6200产品组合新增三款支持Matter标准的系统级芯片(SoC),包括QPG6200J、QPG6200M和QPG6200N(注:信息源自Qorvo官方新闻稿)。这一扩展标志着Qorvo在智能家居与工业物联网领域的进一步突破,通过ConcurrentConnect™技术与超低功耗架构,为多协议设备提供无缝互操作性与高效能支持。

双城启幕,共探软件定义未来——MATLAB EXPO 2025中国用户大会即将开启沪京双城科技盛宴

北京,2025年5月19日——在数字化浪潮重塑产业的当下,MathWorks正式公布MATLAB EXPO 2025中国用户大会的革新布局。这场年度技术盛会将于5月20日登陆上海国际会议中心,5月27日移师北京国家会议中心,首创"沪京双城"联动态势。本届大会聚焦"软件定义产品"的产业革命,通过50+深度技术研讨与行业实践案例,系统展示MATLAB®和Simulink®在智能驾驶、新能源系统、脑科学计算、无人机集群等前沿领域的技术突破,汇聚全球500强企业技术领袖、科研院所专家及创新团队,共同解构数字化工程转型的底层逻辑与实施路径。

康盈半导体扬州基地投产:国产存储产业链再添“芯”动能

在全球半导体产业加速重构的背景下,中国存储企业正通过技术创新与产业链整合抢占战略高地。2025年5月16日,康盈半导体扬州存储模组智造基地正式投产,标志着其在存储领域的全产业链布局迈出关键一步。这一项目的落地,不仅为国产存储技术自主可控注入新动能,也为区域经济转型升级提供了示范样本。