发布时间:2012-07-31 阅读量:1237 来源: 我爱方案网 作者: EchoTang
随着电子设备智能化程度及互动能力的不断提高,语音、图像和手势等人机接口相继出现,以满足消费者对速度更快、互动性更强的信息访问方式的需求。iPhone 4S富有差异化特色的Siri语音输入暨识别功能翻开了语音识别在智能手机市场的新篇章,越来越多的制造商开始希望在最短的时间内开发出媲美Siri或甚至超越Siri性能的带语音识别功能的智能手机。
目前市场上人机接口语音功能一般由主CPU来处理,效果自然不能满足越来越挑剔的消费者。主CPU除了需要处理语音识别之外,还需要处理如高清视频、3D导航等,为处理能力和存储器带宽带来了计算、资源使用的瓶颈,特别是像语音识别需要很多资源密集型应用而言,更会形成这种瓶颈。如果将此功能让分立的语音协处理器来处理,就能营造出更好的用户体验。
IDC半导体部高级分析师Michael Palma补充道:“在当今的计算设备中,CPU需要处理从高速互联网接入、高清视频到3D导航和语音识别的几乎所有任务,结果为处理能力和存储器带宽带来了瓶颈问题。利用具体应用协处理器来处理语音评分任务,可以极大地改善语音识别系统的响应能力和延迟表现,同时为CPU腾出更多处理能力以集中处理其他资源密集型应用,从而在整体上营造出更好的用户体验。”
为满足这一新兴市场的特殊要求,NOR闪存主要供应商Spansion公司最近宣布推出Spansion语音协处理器(简称Spansion ACP),这是业界首款支持语音控制系统接口的人机接口(HMI)协处理器。
图一:语音识别的实现
目前,用户接口依赖于通用型硬件和软件。Spansion语音协处理器是首款具体应用型产品,它将定制型逻辑和硬件与Nuance公司的VoCon软件引擎完美地结合起来,为诸如语音之类的自然用户接口提供了一种专用资源。
Spansion执行副总裁兼全球业务总经理Glenda Dorcha介绍说:“虽然高端应用处理器正从单核快速转向双核和四核,但人机界面(UI)仍将是一个计算密集型功能,要求独立的硬件加速器和灵活的软件算法,应用协处理器来处理语音任务,可以极大地改善语音识别系统的响应能力和延迟表现,同时可为CPU腾出更多处理能力以集中处理其他资源密集型应用。”
凭借Nuance Communications公司的语音技术,该款新产品是汽车、游戏和消费电子领域语音识别系统的理想之选。此外,该产品支持更大的语音数据库,与常规语音接口相比,可以显著提高响应时间和精度。Spansion语音协处理器由定制型逻辑和高速存储器构成,有利于加快和优化语音控制人机接口,同时还可消除常规CPU在处理语音数据时的工作负荷。
Spansion ACP专为Nuance VoCon的语音识别(Voice Recognition)引擎而优化。具体来说,Spansion ACP加速了语音识别过程的音阶分析评估阶段,将传入的数字声音与语音数据库内容进行比对。此音阶评估是Nuance语音识别技术的主要组成部分,由定制型逻辑和高速存储器构成,有利于加快和优化语音控制人机接口,同时还消除CPU在语音处理数据时候的工作负荷。
图二:Spansion语音协处理器[member]
应用处理器和DSP解决方案的不足
与仅采用应用处理器的典型系统相比,使用语音协处理器可使系统响应速度提高50%,应用处理器上的负载最多可下降50%。因此ACP定位在声控电子技术领域,并应用在汽车、消费电子和游戏机市场。
与现有的基于DSP的语音协处理器解决方案相比,Spansion市场营销和业务开发总监范承华表示:“Spansion ACP是同类中第一个以硬件为基础的协处理器,并专为Nuance VoCon的语音识别(Voice Recognition)引擎而优化。具体来说,Spansion ACP加速了语音识别过程的音阶分析评估阶段,将传入的数字声音与语音数据库内容进行比对。此音阶评估是Nuance语音识别技术的主要组成部分,因此ACP定位在声控电子技术领域,并应用在汽车、消费电子和游戏机市场。”
他强调指出,现有的欧胜(Wolfson)方案通常着重在语音识别过程的音效处理阶段;此阶段将传入的模拟语音信号转换为数字语音模式,并在执行时降低噪声、消除语音回音和形成语音波束。这些解决方案在ACP语音识别过程中有互补作用。另一家Sontia公司的产品主要针对扬声器,因此与ACP并不相关。
图三:Spansion市场营销和业务开发总监范承华
汽车是Spansion第一目标市场
Spansion ACP目前在市场上暂时还没有实力较强的竞争对手,短期内道路会比较平坦。Spansion在中国已经有益登科技、威健、北高智电子、艾睿电子和安富利五个主要分销商,以及汇新电子和亚讯科技这两个较小的分销商。
范承华表示,在中国我们目前正与有兴趣于ACP的客户合作。目前而言,讨论具体的成功案例仍言之过早。
Nuance公司移动事业部执行副总裁兼总经理Michael Thompson表示:“Spansion以特有方式整合Nuance公司的技术,为汽车制造商提供了一种极其强大的平台。专业协处理器可以使语音互动变得极其快速、更加自然、甚至更加准确。”
Spansion战略联盟及业务开发资深副总裁Ali Pourkeramati表示:“随着人机互动的不断普及,市场上出现了对更加自然的用户接口的需求,而语音则走在了前列。我们的新型语音协处理器产品进一步巩固了我们的战略,即提供具有附加价值的系统能力,推动客户产品的差异化进程,促进互联智能设备的大规模普及。凭借我们在汽车和嵌入式存储器领域的领先优势,我们设计出了一种新的系统平台,它可以快速读取和分析数据,使用户体验迈上新的台阶。”
Strategy Analytics汽车消费调查总监Chris Schreiner表示:“语音识别技术的进步缩短了我们与自然语言理解之间的距离,这对汽车市场来说是至关重要的。越来越多的汽车制造商开始在汽车中装入语音识别接口,用于管理移动连接,同时提高驾驶安全系数。精度和延迟方面的改善,就像通过Spansion语音协处理器等创新技术所实现的一样,可以给消费者带来极大的便利,并改变我们与汽车的互动方式。”
Strategy Analytics中国区汽车研究总监徐震宇表示:“到2012年,中国原始设备制造商(OEM)所提供的具备语音人机接口的信息娱乐和车载信息通讯系统(telematics)的出货量将达到300万台,并預期在2018年达到2,000万台。开发厂商诸如Spansion语音协处理器这类的语音识别解决方案,必将刺激市场接受度,加强消费满意度。”
Spansion语音协处理器充分利用了Spansion久经验证的技术,及其在各类嵌入式应用中实现即时响应、高可靠性和性能方面的领先优势。基准检测结果显示,与仅采用应用处理器的典型系统相比,使用Spansion语音协处理器可使系统响应速度提高50%。应用处理器上的负载最多可下降50%,使其可以腾出空间处理其他任务。另外,Spansion语音协处理器能够支持更大的语音数据库(包括多语言,语音性别和声调),这样一来提高了准确性并促进了自然语言理解。
Spansion技术的首次应用是在汽车市场。在该市场中,语音提供了一种更安全、更智能的驾驶连接技术,同时最大限度地减少了手持设备的视觉-手动干扰。Spansion演示平台集成了Spansion的技术和Nuance的语音识别软件,目前,多家大型汽车制造商正在对其进行评估,今年第三季度将开始提供设计样片。
Spansion ACP可媲美Siri吗?
ACP架构包括定制逻辑和高速片上闪存,两者间通过1.2GBps高速接口互连。此片上闪存基于Spansion 高性能和高可靠性的 MirrorBit NOR flash 技术,是语音数据库的存储位置。根据Spansion 的测试结果,此种独特的架构设计可提供最高性能的音效,并协助降低50%左右的反应延迟和CPU负载。
范承华说:“就我们所知,ACP是同类中第一个提供独特架构和功能,使用Nuance语音识别引擎来增进语音识别的电子系统。ACP可与DSP许多解决方案并存,协助语音处理功能。”
Siri技术智能程度已经很高,它可以联系上下文来理解说话者的意思,那么Spansion ACP能不能达到这个水平呢?范承华表示:“语音识别的准确性有赖于Nuance提供的语音数据库大小。数据库越大,语音识别结果越准确。以现有的语音数据库而言,ACP减少大约50%的延迟和50% CPU 负载,而Nuance是著名的语音和图像解决方案提供商,数据库的扩大只是时间的问题。ACP旨在支持所有使用Nuance Vocon 引擎的语言。”
此外,他强调指出:“就我们所知,Siri主要是基于连接到云端(Cloud)的网络技术。相反,Spansion ACP是为嵌入式系统设计,不论有无云端支持皆可执行语音识别。鉴于ACP是本地协处理器,相较于在大多数情况下纯粹云端提供的解决方案,我们相信ACP可提供更高的性能。”
目前,Spansion已可支持英语,而且还正在开发其他语言的功能。展望语音协处理器的未来,嵌入式系统的语音识别将朝向自然语言理解发展,人机对话将更趋于人人对话。
范承华指出:“此一趋势将需要更大量的语音数据库,因此需要配备更多运算和内存带宽的嵌入式系统。Spansion ACP具有独特的优势来支持这一趋势,藉由减少约50%的延迟和CPU负荷,并改善语音识别体验。”
无人机系统(Unmanned Aerial Systems, UAS)作为“低空经济”的核心载体,正以前所未有的深度和广度渗透至众多产业领域,驱动效率变革与模式创新。其核心价值在于提供高灵活性、低成本和高精度的空中解决方案,显著提升了传统作业方式的效能。
市场研究权威机构Omdia最新报告揭示,智能手机显示技术格局已发生根本性转变。2025年第一季度,采用AMOLED面板的智能手机出货量在全球总市场中占比高达63%,较去年同期的57%实现大幅跨越,标志着AMOLED已成为无可争议的主流标准。与此同时,LCD面板的份额被压缩至37%,延续了长期的萎缩态势。
7月16日,第三届中国国际供应链促进博览会(链博会)在京开幕。美国科技企业英伟达公司首席执行官黄仁勋身着唐装亮相开幕式,并在现场透露重要业务进展:该公司专为中国市场设计的H20人工智能芯片已获得美国商务部出口许可,即将启动批量供货。
近日,楷登电子(Cadence Design Systems, Inc., NASDAQ: CDNS)宣布其业界领先的LPDDR6/5X内存IP系统解决方案已成功完成流片验证。该集成化子系统通过技术优化,实现了高达14.4Gbps的运行速率,相较上一代LPDDR标准内存接口,性能提升幅度达到50%。此套先进解决方案被视为扩展人工智能(AI)基础架构的关键驱动技术之一。它旨在满足日益增长的新一代AI大语言模型(LLM)、代理型AI(Agent AI)以及众多垂直应用领域对超高内存带宽和容量的迫切需求,以高效支持这些计算密集型工作负载。楷登电子当前已与AI、高性能计算(HPC)及数据中心领域的多家头部客户展开紧密合作,共同推进该技术的应用落地。
作为全球授权电子元器件代理商,贸泽电子(Mouser Electronics)持续深化与德州仪器(TI)的战略合作,确保69,000余款TI器件的高效供应,其中45,000余款保持常态库存,可实现全球快速交付。通过整合TI在电源管理、数据处理及控制系统的完整技术生态,贸泽为工业自动化、汽车电子、通信基建、企业级设备等核心领域提供端到端解决方案支持。