科大讯飞能称霸智能语音领域 这五大语音交互技术功不可没

发布时间:2016-11-19 阅读量:5064 来源: 发布人:

2016年11月17日,科大讯飞携最新成果参加了我爱方案网、快包与中国可穿戴计算产业技术创新联盟联合主办探索人工智能、医疗健康、虚拟现实之间的互动论坛,论坛由我爱方案网副总王勤女士主持。论坛上,科大讯飞产品总监王磊分享了智能人机交互服务,以及最新的AI/VR方案。他表示,科大讯飞的产品之所以领先业界,与以下五大关键技术的发展密不可分。



关键技术一:语音合成

语音合成技术主要是根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。王总介绍到,语音合成技术是在讯飞在2010年开发完成的,在这方面,讯飞目前的语音合成的自然度已经超过了普通人。



明星应用场景:讯飞主流的语音技术应用场景很多,比较具有代表性的便是现今网络爆红的高德地图语音导航系统与滴滴打车,高德运用讯飞开放平台的语音合成产品,明星真声合成的语音提示带来人性化的体验,使得高德地图下载量超过平日的6倍,新增用户速率提升230%,每日活跃用户增加36%。

关键技术二:语音识别

语音识别是一门交叉学科,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,科大讯飞的语音识别起步较晚,不过发展的很快,大概是在2014年真正落地。王总介绍到,目前科大讯飞的语音识别技术普通话识别准确率突破95%,并开放包括湖南话、粤语、闽南语等多达十八种方言。



明星应用场景:语音识别APP心声。“这种技术非常有意义,不仅方便日常文字—语音之间的转换,对于聋人群体来说也是一个福利,心声是一款语音识别APP,聋人只需要使用APP就可帮助自己去倾听别人说话,沟通会变得非常简单。”论坛上王总说到。

关键技术三:语义理解

语义理解是衡量人机交互的体验度的一个重要指标,人工智能的核心是认知,而认知的核心是语义理解技术。机器人只有在“懂”了人类的指令后,才能正确执行用户下达的指令。



明星应用场景:三宝机器人。它运用开放平台的语义理解、人脸检测、自主声源定位等技术,让三宝具有像人一样的“看”“听”“嗅”功能,全方位感知周边环境,让用户体验智能家居生活。

关键技术四:麦克风阵列

麦克风阵列,从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。这种技术能够使机器人或者被控制产品在嘈杂环境清楚的辨识真正的语音指令,在酒店、马路等公共场所有非常广泛的应用。



明星应用场景:康力优蓝U05优友机器人。该机器人运用开放平台五麦克风阵列及语音技术,是国内第一款可量产的大型服务机器人。

关键技术五:AIUI人工智能交互界面

王工认为,在万物互联时代,要真正实现流畅的人机交互,必须满足四点:第一是远场降噪;第二是方言识别;第三是全双工,随时随地在听;第四个自动纠错,主动纠错,支持多轮对话、打断、上下文相关。只有这些都具备,才是万物互联时代真正的人机语音交互系统。在这个基础上,科大讯飞以语音为主结合图像视觉及手写识别,将整个人工智能功能集结在一起,推出了业界首个人工智能的用户交互界面——AIUI。



明星应用场景:AIUI。在之前AIUI发布会现场,科大讯飞在全球首次将演讲人的演讲同步转写成文字在大屏幕显示,接受现场数千参会者和数千万观看视频直播观众的检验。王总强调,这个技术亦将是科大讯飞未来的发展方向。

同时,由我爱方案网与科大讯飞联合主办了一场智能硬件设计大赛于今天正式开启,本次活动旨在寻找人工智能领域最具创意的设计者。借力科大讯飞成熟的人工智能交互平台,应用以上五大语音技术,快速接入人工智能风口,寻找创新的种子并共同孵化出创新的解决方案推向市场,我们为最具创意的你准备了六万现金大奖以及科大讯飞十万的语音优质资源,帮助开发者实现业务创新落地,成就你创新梦想。



凡参与本次比赛的选手均可以获得以下福利:
1、获得科大讯飞实习或者工作的机会;
2、获得我爱方案网品牌宣传,优质资源优先对接的机会;
3、获得科大讯飞语音技术支持。而通过比赛筛选入围方案以及最佳方案均将获得科大讯飞价值十万语音优质资源,还有丰厚的现金大奖等着你!

目前,活动整在火热报名中,报名时间将持续到2016年12月18日。人工智能正在改变世界,开发奖金、创业风口、投资机会正在向你招手,准备好了就来挑战吧!

活动报名入口:http://www.52solution.com/index.php/Home/Special/kdxf

相关资讯
贸泽电子发布智能家居开发平台,集成Arduino/NXP/Qorvo创新方案

为加速智能家居的普及与创新,全球知名电子元器件分销商贸泽电子重磅推出全新的 “智能家居资源中心”。该中心汇聚海量精选技术资料,为工程师打造下一代自动化与互联解决方案提供强力支持。随着智能恒温器、冰箱等物联网设备深入家庭生活,用户对个性化体验、能源效率与安心安全的需求激增。工程师们正面临着融合如三频通讯、Matter协议等前沿技术以构建无缝智能生态系统的挑战。贸泽的资源中心正是为此而生,致力于简化设计流程,将未来互联家庭的愿景变为现实。

思特威突破车载视觉"卡脖子"难题:首颗全流程国产3MP CIS量产

在全球汽车产业加速迈向智能化、网联化的浪潮中,高可靠、高性能的车载图像感知系统扮演着至关重要的角色。环视摄像头作为感知车辆周边环境的“眼睛”,其性能直接关系到驾驶安全与辅助驾驶功能的体验。2025年7月,思特威(上海)电子科技股份有限公司(股票代码:688213)正式发布Automotive Sensor (AT) Series系列的重要成员——SC326AT。这不仅是一款3MP(300万像素)高性能车规级CMOS图像传感器新品,更是思特威车载系列中首款实现设计、制造到量产全流程国产化的里程碑式产品。它基于思特威自研的CarSens®-XR工艺平台打造,在核心成像性能、环境适应性及系统集成度上均实现显著突破,直指高端环视应用的痛点,为提升智能汽车感知系统的韧性与竞争力提供了强有力的国产化支撑。

苹果芯片版图再扩张!7款自研芯片曝光,深化垂直整合战略

根据近期知名开发者社区曝光的最新信息显示,苹果正在加速其芯片自研进程,计划推出至少7款尚未对外公开的全新芯片设计。这一雄心勃勃的计划涵盖了其核心终端产品线,包括应用于未来iPhone的A19系列、下一代Mac的M5系列、新款Apple Watch处理器、第二代5G调制解调器C2,以及一款具备突破性集成设计的通信芯片Proxima。多项证据表明,苹果正加速推进全产品线核心处理器代际更新,深化垂直整合优势。

轴向电阻SMD化!Vishay AC03-CS WSZ系列降本增效解决方案详解

在现代电子制造业,提升自动化装配效率与降低生产成本是企业持续追求的目标。通孔元件(THT)在贴装环节往往需要额外的插件工序,相较表面贴装元件(SMD)效率较低。针对这一行业痛点,全球领先的电子元件制造商威世科技(Vishay Intertechnology, Inc., NYSE: VSH)宣布其广受欢迎的AC03-CS系列轴向绕线安全电阻推出创新的WSZ引线版本选件。这一设计革新使得原本需要插件工艺的轴向电阻能够无缝融入标准的SMT(表面贴装技术)生产线,显著缩短装配周期并有效控制整体制造成本。本次升级为汽车电子、工业驱动及智能能源等领域的关键安全电路设计提供了兼具性能与成本效益的全新解决方案。

Meta豪掷2亿美元争抢AI顶尖人才,超级智能团队组建引发行业震动​

全球人工智能人才争夺战已进入白热化阶段。Meta公司近期以突破行业纪录的薪酬方案招募前苹果公司AI模型研发负责人庞如明(Ruoming Pang),据悉该方案总价值逾2亿美元,包含现金奖励与长期股权激励。此举标志着科技巨头对顶尖AI人才的投入达到前所未有的量级。