语音识别还没飞起来,谷歌“唇语识别”又来了

发布时间:2016-11-29 阅读量:803 来源: 我爱方案网 作者: cywen

人工智能技术近年来突飞猛进,微软等硅谷巨头甚至宣称其语音识别系统已经能媲美人类。现在谷歌的AI在语言理解能力上更上一层楼,不仅可以通过更好的唇语识别来帮助听力障碍人士,多语言神经机器翻译(Multilingual Neural Machine Translation)也将显著提高翻译质量。


谷歌母公司Alphabet下属的DeepMind部门和牛津大学的研究者使用新闻视频对其AI系统进行训练。用于训练的视频总长超过5000小时,语句超过118,000句。视频取材自BBC电视台自2010年至2015年间播出的节目。训练完毕后,研究人员使用该系统对今年3月~9月间播出的口语节目进行测试。测试结果发现,系统通过“观看”说话者嘴部动作便可以准确识别出整个句子。比如“我们知道这里也会有数百位记者”。(We know there will be hundreds of journalists here as well)

给予相同的视频素材,专业的唇语识别专家能够达到12.4%的正确率。而AI系统识别正确率是46.8%。

前不久谷歌开始在“谷歌翻译”中运用神经机器翻译技术,能够识别准确地识别句子而不再仅仅是单词翻译。现在谷歌宣称使用多语言神经机器翻译技术后,谷歌翻译的翻译效果将再上一层楼。

谷歌在博客中称:“我们提出的结构无需改变基本的GNMT系统,而是在开头使用一个额外的‘token’来指定所需的目标语言翻译。”除了能够提高翻译质量,新的方法还支持“Zero-Shot Translation”,即在没有已知数据的情况下,能够对没有见过的语言进行翻译。

但是这些研究成果产生实际影响还有待时日,现在盛行的语言识别技术还是由语音识别技术占主导,而且就连语音识别技术也还积极拓展市场。
相关资讯
思特威突破车载视觉"卡脖子"难题:首颗全流程国产3MP CIS量产

在全球汽车产业加速迈向智能化、网联化的浪潮中,高可靠、高性能的车载图像感知系统扮演着至关重要的角色。环视摄像头作为感知车辆周边环境的“眼睛”,其性能直接关系到驾驶安全与辅助驾驶功能的体验。2025年7月,思特威(上海)电子科技股份有限公司(股票代码:688213)正式发布Automotive Sensor (AT) Series系列的重要成员——SC326AT。这不仅是一款3MP(300万像素)高性能车规级CMOS图像传感器新品,更是思特威车载系列中首款实现设计、制造到量产全流程国产化的里程碑式产品。它基于思特威自研的CarSens®-XR工艺平台打造,在核心成像性能、环境适应性及系统集成度上均实现显著突破,直指高端环视应用的痛点,为提升智能汽车感知系统的韧性与竞争力提供了强有力的国产化支撑。

苹果芯片版图再扩张!7款自研芯片曝光,深化垂直整合战略

根据近期知名开发者社区曝光的最新信息显示,苹果正在加速其芯片自研进程,计划推出至少7款尚未对外公开的全新芯片设计。这一雄心勃勃的计划涵盖了其核心终端产品线,包括应用于未来iPhone的A19系列、下一代Mac的M5系列、新款Apple Watch处理器、第二代5G调制解调器C2,以及一款具备突破性集成设计的通信芯片Proxima。多项证据表明,苹果正加速推进全产品线核心处理器代际更新,深化垂直整合优势。

轴向电阻SMD化!Vishay AC03-CS WSZ系列降本增效解决方案详解

在现代电子制造业,提升自动化装配效率与降低生产成本是企业持续追求的目标。通孔元件(THT)在贴装环节往往需要额外的插件工序,相较表面贴装元件(SMD)效率较低。针对这一行业痛点,全球领先的电子元件制造商威世科技(Vishay Intertechnology, Inc., NYSE: VSH)宣布其广受欢迎的AC03-CS系列轴向绕线安全电阻推出创新的WSZ引线版本选件。这一设计革新使得原本需要插件工艺的轴向电阻能够无缝融入标准的SMT(表面贴装技术)生产线,显著缩短装配周期并有效控制整体制造成本。本次升级为汽车电子、工业驱动及智能能源等领域的关键安全电路设计提供了兼具性能与成本效益的全新解决方案。

Meta豪掷2亿美元争抢AI顶尖人才,超级智能团队组建引发行业震动​

全球人工智能人才争夺战已进入白热化阶段。Meta公司近期以突破行业纪录的薪酬方案招募前苹果公司AI模型研发负责人庞如明(Ruoming Pang),据悉该方案总价值逾2亿美元,包含现金奖励与长期股权激励。此举标志着科技巨头对顶尖AI人才的投入达到前所未有的量级。

OLED面板市场呈现结构性调整:2025年Q1收入回暖,但全年增长承压

根据Counterpoint Research于7月9日发布的全球OLED面板市场追踪报告,2025年第一季度行业收入同比增长2%,成功扭转了2024年第四季度同比下降3%的颓势。这一复苏主要得益于增强现实(AR)眼镜、车载显示、智能手表、电视及显示器五大品类出货量的加速增长,推动整体出货量同比上升4%。