认知技术如何与人类互动?从智能手机到自动驾驶来看!

发布时间:2016-07-27 阅读量:1088 来源: 我爱方案网 作者:

【导读】认知技术能让终端和事物根据环境凭直觉感知(像人类一样地看和听)、推理(通过分析所处环境并进行预测需求)和行动。认知技术受人类大脑的启发可作为人类感觉的自然延伸,扩展人类的能力。这些技术还将根据环境为我们提供个性化体验,同时在终端和事物之间创造出更类似于人类的互动。

简单的说,认知技术能让智能手机/机器人等根据所处的位置和环境、以往习惯,甚至是语音识别和物体识别来提取信息,以及预测我们的需求,并在恰当的时间为我们提供相关信息。也许有些人觉得该技术与我们相距甚远,尤其是机器人领域的,现在不妨从生活应用说起。
手机扫描二维码是移动互联网时代的标志,过去我们扫描二维码都是通过专用APP去识别,这是非智能的被动识别,本质是用户告诉手机你拍到的是二维码,请帮我解析。但最近笔者使用三星Galaxy S7手机拍摄照片时候发现,如果被摄物有二维码或者条形码,手机会自动在取景时候会直接进行对象识别(无任何延迟),并提醒笔者查看内容:
点击查看信息的时候直接跳到百度搜索界面并准确搜索到了相关产品,这就是主动识别。这一功能运用得当会有意想不到的效果,比方说外出游玩时候,拍摄照片时如果含有警告字样会自动提出警告就是相当有用的功能。
认知技术包括机器学习、仿真计算机视觉、智能连接以及永久感测等,赋予机器更强大的直觉,能够更了解我们的喜好和所处环境(摄像头拍到的内容被识别为含有条形码),然后预测我们的需求(需要搜索产品的详细信息以及价格),并在恰当的时间为我们提供相关信息。认知技术受人类大脑的启发可作为人类感觉的自然延伸,扩展人类的能力。这些技术还将根据环境为我们提供个性化体验,同时在终端和事物之间创造出更类似于人类的互动。

认知技术的宽广舞台

前文中介绍手机摄像头根据拍到的内容识别条形码只是认知技术应用的冰上一角,认知技术在智能手机、汽车自动驾驶、机器人等领域还有更广阔的空间,比如我们在介绍Zeroth计算平台时提到的计算机视觉。计算机视觉是智能终端感知的重要成分,其重要性等同于人类视觉。
认知技术的宽广舞台
高通平台下的计算机视觉由Qualcomm Spectra ISP、Qualcomm Hexagon DSP、Qualcomm Adreno GPU以及CPU组成的异构运算铁三角负责。这些计算模块分别扮演了特殊的角色,能够在非常低的功耗下实现智能识别。

高通智能捕捉功能(Clever Capture)可以检测人的动作或面部微笑,然后触发照片连拍功能,自动选择最心仪的照片。下图就是运用此功能自动捕捉到的水球破裂瞬间的照片。
认知技术的宽广舞台
在过去手机摄影最难的就是瞬间捕捉,美妙的瞬间往往在毫秒间流逝,捕捉的方法只有实时感测,将按下快门之前的图像也记录下来,这就需要Hexagon DSP的鼎力协助,否则功耗将变得难以接受,所幸当今平台已经可以实现这一功能。

摄影只是计算机视觉的一部分,高通骁龙文本激活功能(Snapdragon Text Activation)可以读取和解释现实世界中的文字,并提出适当操作或应用建议。比如说当名片出现在手机的取景器中时,骁龙文本激活功能将会识别网址,并询问你是否想在浏览器中打开它;也可以识别地址,您可以选择是否直接在地图应用中打开。

环境感知是认知技术又一重要组成,这一前提就是不同的传感器会持续记录数据,并在观察我们的行为后将其智能地与数据组合在一起。这是Hexagon DSP的传感器融合技术的拿手好戏,它配备着“始终开启”的传感器。

以车载骁龙处理器为例,“始终开启”的传感器让汽车能够不断了解其周围环境,提升驾驶体验。骁龙820 Automotive芯片组具有驾驶辅助功能,能提供车道偏离警告、车辆前方碰撞探测警告,以及交通标志识别功能以避免错过那些不易看到的停车标志。增强型3D导航可进行实时更新,将车道和交通标志在地图上标识出来,提供从A点到B点的最便捷路线。
(骁龙820 Automotive芯片组)
(骁龙820 Automotive芯片组)

先进的摄像头和传感器处理能持续提供“始终开启”的预警和应急服务。芯片上的图像信号处理器能同时支持连接4到8个汽车摄像头传感器,而智能后视摄像头在倒车时可使用先进的计算机视觉来探测对象。同时,包括在V2X(车辆与万物互联)类别中的车辆与移动终端连接,以及V2V(车辆与车辆连接)警告,可以通过向汽车、智能手机应用或连接可穿戴设备发出警报来避免碰撞。
(骁龙820 Automotive芯片组)
这些终端处理的关键就是高通骁龙的异构运算设计。异构架构是移动终端在有限温度、体积以及功耗要求下实现认知技术的保障,也是未来机器人和无人机平台实现更强大功能的保证,通过机器学习和计算机视觉技术,它们能够适应我们的需求,避开环境中会遇到的问题。

再来看看智能手机方面,Zeroth平台能够在连接方面带来稳定的移动体验。新一代骁龙820处理器,集成X12 LTE调制解调器,其通过使用IP多媒体子系统(IMS),支持下一代高清LTE语音(VoLTE)和LTE视频(ViLTE)通话服务,同时还支持LTE和Wi-Fi间的通话连续性。借助Qualcomm Zeroth的认知能力,X12 LTE调制解调器能够实时监测Wi-Fi连接质量,以决定是否以及何时在LTE与Wi-Fi间切换通话。

以上简单列举了当前认知技术的一些使用场景——在拍照界面下自动识别拍摄内容是否为条形码;带来更加安全、智能的驾车体验;通过智能手机为用户带来更好的移动体验。可以看出,认知技术已经围绕在我们身边,并且未来随着技术和设计的进一步提升,认知技术必将大施拳脚,迎来更加广阔的前景。


相关资讯
应对多轨供电挑战!SGM260320 PMIC提供小型化、高效能解决方案

在追求电子设备小型化、高性能和超低功耗的时代,复杂的多轨电源设计已成为研发的关键挑战。传统分立式电源方案不仅占用宝贵的PCB面积,也增加了设计难度与系统功耗控制的复杂性。固态硬盘(SSD)、现场可编程门阵列(FPGA)、微控制器单元(MCU)系统及便携设备对电源管理集成电路(PMIC)的要求日益严苛:高效转换、低待机功耗、高集成度、精确调压以及智能化管理缺一不可。圣邦微电子(SG Micro)推出的SGM260320 PMIC,正是瞄准这一市场需求,以高度集成、卓越性能和丰富的可配置功能,提供了一站式的高效供电解决方案。

突破中端市场壁垒!TDK超薄IMU让全民享受专业级OIS防抖

随着智能手机影像功能逐渐成为用户核心需求,光学防抖(OIS)技术正面临前所未有的性能挑战。TDK株式会社凭借旗下InvenSense公司15年OIS/EIS技术积累,最新推出的SmartMotion® ICM-536xx系列六轴IMU,正在打破高端防抖技术的成本壁垒。该方案通过突破性的6.4kHz输出数据速率和20位分辨率,首次将专业级防抖性能引入主流移动设备市场。

全球机器人装机量下滑3%,中国份额54%成唯一亮点​

2024年,全球工业机器人市场经历了一次明显的周期性调整。国际机器人联合会(IFR)的初步统计数据显示,全年新装机量约为52.3万台,较上年下滑约3%。这是近年来该市场罕见出现的负增长,反映出多重经济与技术周期叠加下的复杂局面。

破局十年空窗 三星携三层堆叠图像传感器强势重返iPhone供应链​

科技行业的顶级联盟再次激活。三星电子近日正式宣布,将与苹果公司展开深度合作,为其下一代智能手机供应关键的图像传感器。这标志着三星自2015年为iPhone供应A9芯片后,时隔近十年重归苹果核心芯片供应链,堪称其半导体业务的一次重大战略回归。

三安光电SiC MOSFET批量供货数据中心巨头,加速全球市场渗透

三安光电近期在投资者互动平台确认,其子公司湖南三安的碳化硅MOSFET器件已实现规模化交付,主要客户包括台达电子、光宝科技、长城汽车子公司及维谛技术等企业。这些合作伙伴专注于数据中心和人工智能服务器的高效电源系统,标志着三安光电在高压半导体领域取得重大突破。最新行业报告显示,2025年全球数据中心电源管理市场对SiC器件的需求同比激增30%,三安光电借此成功切入国际供应链,为海外扩张奠定坚实基础。