人机交互之智能语音产业链及核心技术分析

发布时间:2016-07-4 阅读量:2210 来源: 我爱方案网 作者:

【导读】在前不久互联网女皇”玛丽米克尔最新发布的2016年的互联网趋势报告中,首次用近1/4的篇幅论述语音识别交互带来的改变,将语音功能赞誉为“人机交互的新范式”。随着万物互联时代的到来,无屏、移动、远扬将成为人们未来生活的新状态。以语音为主,键盘、触摸等为辅的人际交互时代正在到来。

智能语音人机交互是什么?

简单说,就是一种以语音为主要信息载体,让机器具有像人一样“能听会说、自然交互、有问必答”能力的综合技术。具体实现过程为机器识别并分析提取语音信号语义特征信息,与标准信息库中的语义特征相对比,输出相应文字或转化成我们想要的输出结果。其交互的对象人与人(语音远程距离通信)、机器人和人、机器人和机器人之间,该项技术让不同交互对象可以自由进行高效信息传递。其需完成身份认证、语义理解、语音应答、语音压缩编码等过程。

智能语音人机交互

Siri的出现,使得智能语音人机交互产业发展迎来了新的高峰。主要体现为:一是技术水平不断提高,特别是语音合成和基础语音识别技术发展较快;二是产业规模持续扩大,带动了家电、汽车、移动互联网、音频设备等一批相关产业的发展;三是优秀企业大幅涌现,出现了如Nuance、谷歌、科大讯飞、捷通华声等一批优秀的企业。

智能语音人机交互产业链分析

经过多年的发展,智能语音人机交互产业形成了从核心技术研发到知识库提供再到应用、服务的完善的产业链。

智能语音人机交互产业链

(一)核心技术研发

包括人工智能机器人厂商、人机交互技术和渠道提供商,以及基础平台支撑和关联技术提供商。

1、人工智能机器人厂商

主要包括小i机器人等智能机器人厂商,以及清华、中科院等人工智能技术研究院校和科研院所。

2、人机交互技术或渠道提供商

包括Nuance、科大讯飞、捷通华声、车音网等语音技术提供商,以及短信(移动、电信、联通)、QQ、MSN等服务提供商。

3、基础平台支撑和关联技术提供商

包括IDC、云计算平台、数据挖掘等技术提供商。

(二)知识库提供

主要是指数据和内容提供商,包括影视(百事通、优酷、土豆、奇异、华数等)、电影票(格瓦拉等)、音乐、餐饮(大众点评、订餐小秘书)、股票(新浪财经、东方财富网等)、天气(问天网)、航班(携程、去哪儿)、旅游(携程、驴妈妈)、导航(高德、凯立德等)、音频广播、政府、行业知识库等。

(三)应用、服务

1、智能电视提供商

包括长虹、创维等智能电视提供商、机顶盒提供商,以及东方有线、百事通、中国电信IPTV以及机顶盒生产厂商、服务运营商等,也可以包括费通、盛付通等支付渠道商。

2、智能车载设备提供商

包括各车厂、汽车安全信息服务提供商(如安吉星等)、车载信息服务提供商(如高德、凯立德等)等。

3、电话呼叫中心

包括移动、电信、联通各运营商,以及以金融为代表的大型现代服务企业,还有面向中小型企业的综合服务平台等。

4、智能移动终端厂商

包括以华为、联想、盛大、中兴等为代表的智能移动终端厂商。

5、智能家居厂商

包括以海尔、典众智能为代表的智能家居厂商。

智能语音人机交互核心技术分析

基于语音的智能人机交互是当前人机交互技术的主要表现形式,语音人机交互过程包括信息输入和输出的交互、语音处理、语义分析、智能逻辑处理以及知识和内容的整合。

 智能语音人机交互核心技术分析

结合语音人机交互过程,可以看出智能语音人机交互关键技术主要如下:

(一)自然语言处理

包括中文分词、词性标注、实体识别、句法分析、自动文本分类等技术。

(二)语义分析和理解

包括知识表示、本体理论、分领域的语义网络、机器推理等。

(三)知识构建和学习体系

包括搜索技术、网络爬虫、数据挖掘、知识获取、机器学习等技术。

(四)语音技术

包括语音识别、语音合成和声纹识别等。

(五)整合通信技术

包括跨平台即时通讯整合技术、超大负载消息集群处理技术、移动客户端开发技术。

(六)云计算基础技术

包括海量数据分布式存储、统计和分析技术。

智能语音人机交互技术的应用领域

语音交互方式替代文本交互方式,可以增强信息输入方式,能和更多的设备进行整合,市场前景广阔。目前,智能语音人机交互技术已经广泛应用到智能客服、智能终端等领域,切实深入到人们的生活。

(一)智能客服

传统的客户服务中心以电话呼叫中心为主,并且很多大型服务企业在不断拓展更为经济高效的电子渠道,如网上在线客服、短信、智能手机应用等。而以领域客户化知识库建设为核心工作,并通过文本或语音等方式交互的智能客服系统则可以有效地和多渠道的客户服务中心做整合。在大幅缩减客服成本的同时,能够有效减少人工成本,增强用户体验,从而提升服务的质量和企业创新的品牌形象。

(二)智能终端

以智能手机、平板电脑、智能电视、智能汽车为代表的智能终端是智能语音人机交互技术最广泛的应用。在苹果Siri的带动下,包括Android、WP以及采用这些操作系统的平板电脑,都有采用类似Siri的智能应用的强烈需求。谷歌预计目前大约有25%的Android设备通过语音进行搜索。根据Strategy Analytics的预期,中国原始设备制造商(OEM)所提供的具备语音人机接口的信息娱乐和车载信息通信系统的出货量达将在2018年达到2000万台。移动终端有望成为智能语音技术的一个快速增长市场。

不过,从目前快包平台的发包任务看,目前语音交互技术在智能耳机、麦克风、在线语音识别等娱乐音频产品的应用需求居多。

相关资讯
“中国芯”逆袭时刻:新唐携7大新品打造全场景AIoT解决方案矩阵

在万物互联与智能化浪潮席卷全球的今天,新唐科技以颠覆性创新奏响行业强音。4月25日,这场历时10天、横跨七城的科技盛宴在深圳迎来高潮,以"创新驱动AI、新能源与车用科技"为主题,汇聚全球顶尖行业领袖,首次公开七大核心产品矩阵,展现从芯片设计到智能生态的全链条创新能力,为半导体产业转型升级注入新动能。

半导体先进制程技术博弈:台积电、英特尔与三星的差异化路径

在2025年北美技术研讨会上,台积电正式宣布其A14(1.4nm)工艺将于2028年量产,并明确表示无需依赖ASML最新一代High NA EUV光刻机。这一决策背后,折射出全球半导体巨头在技术路线、成本控制和市场竞争中的深层博弈。

嵌入式主板EMB-3128:轻量级边缘计算的工业级解决方案

随着AIoT技术的快速落地,智能设备对高性能、低功耗嵌入式硬件的需求持续攀升。华北工控推出的EMB-3128嵌入式主板,搭载Intel® Alder Lake-N系列及Core™ i3-N305处理器,以高能效比设计、工业级可靠性及丰富的接口配置,成为轻量级边缘AI计算的理想选择。该主板支持DDR5内存、多模态扩展接口及宽温运行环境,可广泛应用于智能家居、工业自动化、智慧零售等场景,助力产业智能化升级。

从ASMI财报看行业趋势:AI芯片需求爆发如何重塑半导体设备市场?

作为全球半导体沉积设备领域的龙头企业,荷兰ASM国际(ASMI)近日发布2024年第一季度财报,展现强劲增长动能。财报显示,公司当季新增订单额达8.34亿欧元(按固定汇率计算),同比增长14%,显著超出市场预期的8.08亿欧元。这一表现主要受益于人工智能芯片制造设备需求激增与中国市场的战略性突破,同时反映出半导体产业技术迭代与地缘经济博弈的双重影响。

车规级SerDes国产替代提速:解析纳芯微NLS9116/NLS9246技术优势与市场潜力

随着汽车智能化加速,车载摄像头、激光雷达、显示屏等传感器数量激增,数据传输带宽需求呈指数级增长。传统国际厂商基于私有协议(如TI的FPD-Link、ADI的GMSL)垄断车载SerDes市场,导致车企供应链弹性不足、成本高企。2025年4月,纳芯微电子发布基于HSMT公有协议的全链路国产化SerDes芯片组(NLS9116加串器与NLS9246解串器),通过协议解耦、性能优化与供应链自主可控,为ADAS、智能座舱等场景提供高性价比解决方案,标志着国产车规级芯片从“跟跑”迈向“并跑” 。