从谷歌地图与Cyberverse来看AI视频技术

发布时间:2019-08-16 阅读量:686 来源: AiChinaTech 发布人: Viva

近日,谷歌地图向所有用户开放了AR导航功能。其实早在去年的I/O大会,谷歌便宣布将会在Google地图中集成这一功能,并已在今年年初向部分Pixel用户提供了Alpha测试版。


image.png 


谷歌AR导航功能称为“实时视图”(Live View),它旨在帮助人更顺畅地进行步行导航。也就是说,这种导航并不适用于传统意义上的汽车导航。但是,当用户在走下汽车并需要步行这样的场景中,它可能会比传统的2D导航更为精准与形象。


众所周知,手机地图导航目前通常借助的是GPS与指南针的结合。利用GPS来进行位置确定,然后以指南针来指示方向。但这往往存在许多问题:比如地图上代表自身位置的蓝点发生了偏移,又比如指南针发生了bug。这些问题在发生时往往容易让人“误入歧途”,耽误了宝贵的时间。


因此,谷歌地图的“实时视图”会将所有指南针投射到外部,而不是通过摄像头和传感器的来实现定向。谷歌称该系统为“VPS”或“视觉定位系统”。手机的GPS缩小了用户的位置,用户的摄像头则收集周边的信息,而谷歌地图的AR模式将相机镜头视图与街景视图中的大量视觉数据相匹配,借助于人工智能AI进行比较分析,从而获得用户所处位置。在谷歌获得用户所在位置的数据基础上,VPS也将清楚到用户在三维空间中的位置和前进方向。这使得它比指南针更准确,从而可以判断用户的确切位置和面向。

巧的是,就在近期的华为开发者大会期间,华为罗巍也正式对外发布了“Cyberverse”。Cyberverse由cyber(Cyber数字)和verse(universe宇宙)构成,寄托了这一功能“开启数字新世界”的愿景,是一项结合AR技术的3D高精度地图服务。


Cyberverse共有4项核心能力,包括3D高精地图能力(HDMAP)、全场景空间计算能力、强环境理解功能和超逼真的虚实融合渲染能力。其中,全场景空间计算能力是全场景的、全天候的,不分室内、室外、白天、晚上等不同的光照条件,都可以提供空间计算定位定姿能力。结合华为的GPS、室内WiFi定位以及VPS定位、SLAM定位等技术组成,Cyberverse在AI的帮助下,可以让手机解算出自身的厘米级定位以及1度以内定姿的高精度位姿信息。而这一点,是Cyberverse能提供AR视觉体验的基础。


不论是谷歌地图还是Cyberverse,都不难看出他们是依托于目前强大的人工智能而存在的。虽然他们的最终目的存在一定的差异化,但其核心都是以AI来对视频中的内容进行识别,从而确定位置,调动后台的实地信息进行引领。


这已经不是人类第一次尝试AI视频识别技术的落地了。在经历了文字、图片的时代之后,能承载大量信息的视频逐渐进入公众的视野,并承担着新一代流量入口的重任。据网络公开数据报告显示,互联网流量70%以上来自视频,未来这个数据将超过90%。


可也正是因为视频的信息量过于巨大,以人力很难对其中的信息进行完整的分辨与解析,更遑论加之以应用。在这种前提下,将AI识别运用于视频之中的想法应运而生。许多企业与个人纷纷开始对此进行研究:比如谷歌去年举办的2018 Google地标识别挑战赛,其获胜者极链科技便是一匹视频AI领域的年轻黑马。它的目标之一,便是通过AI视频识别技术来进行精准的广告投放,从而推动视联网概念的打造。再比如目前风靡的人脸识别支付,也是依托人工智能才得已实现。这些实际应用的成功,充分说明了该技术对于人类的日常生活可以起到一个积极的推动作用。


回到Cyberverse来看,随着它的建设,一种与真实世界关联的全新的虚实融合的交互与视觉体验将出现在用户面前。借助于AI的强大能力,使用者可以看到物理空间的数字属性,如楼宇虚拟标牌、楼宇出入口的虚拟呈现和园区服务设施的虚拟标牌等;也可以看见智慧园区IoT信息,如室内温度湿度,空气质量和人数等楼宇智慧信息,以及会议室名称、预定情况与是否有人等会议室智慧信息等。可以说,Cyberverse不仅能进行3D步行导航,更能带来虚实融合的全新视频体验。

随着科技的发展,AI必将越来越智能化,视频也将演变成我们大部分的信息来源。届时如何去实现两者的结合,如何挖掘出它们更深层次的应用,必将是我们人类所要思考的问题。


相关资讯
华虹半导体2025年Q1业绩解析:逆势增长背后的挑战与破局之路

2025年第一季度,华虹半导体(港股代码:01347)实现销售收入5.409亿美元,同比增长17.6%,环比微增0.3%,符合市场预期。这一增长得益于消费电子、工业控制及汽车电子领域需求的复苏,以及公司产能利用率的持续满载(102.7%)。然而,盈利能力显著下滑,母公司拥有人应占溢利仅为380万美元,同比锐减88.05%,环比虽扭亏为盈,但仍处于低位。毛利率为9.2%,同比提升2.8个百分点,但环比下降2.2个百分点,反映出成本压力与市场竞争的加剧。

边缘计算新引擎:瑞芯微RV1126B四大核心技术深度解析

2025年5月8日,瑞芯微电子正式宣布新一代AI视觉芯片RV1126B通过量产测试并开启批量供货。作为瑞芯微在边缘计算领域的重要布局,RV1126B凭借3T算力、定制化AI-ISP架构及硬件级安全体系,重新定义了AI视觉芯片的性能边界,推动智能终端从“感知”向“认知”跃迁。

半导体IP巨头Arm:季度营收破12亿,AI生态布局能否撑起估值泡沫?

2025财年第四季度,Arm营收同比增长34%至12.4亿美元,首次突破单季10亿美元大关,超出分析师预期。调整后净利润达5.84亿美元,同比增长55%,主要得益于Armv9架构芯片在智能手机和数据中心的渗透率提升,以及计算子系统(CSS)的强劲需求。全年营收首次突破40亿美元,其中专利费收入21.68亿美元,授权收入18.39亿美元,均刷新历史纪录。

Arrow Lake的突破:混合架构与先进封装的协同进化

2024年10月,英特尔正式发布Arrow Lake架构的酷睿Ultra 200系列处理器,标志着其在桌面计算领域迈入模块化设计的新阶段。作为首款全面采用Chiplet(芯粒)技术的桌面处理器,Arrow Lake不仅通过多工艺融合实现了性能与能效的优化,更以创新的混合核心布局和缓存架构重新定义了处理器的设计范式。本文将深入解析Arrow Lake的技术突破、性能表现及其对行业的影响。

暗光性能提升29%:深度解析思特威新一代AI眼镜视觉方案

2025年5月8日,思特威(股票代码:688213)正式发布专为AI眼镜设计的1200万像素CMOS图像传感器SC1200IOT。该产品基于SmartClarity®-3技术平台,集成SFCPixel®专利技术,以小型化封装、低功耗设计及卓越暗光性能,推动AI眼镜在轻量化与影像能力上的双重突破。公司发言人表示:"AI眼镜的快速迭代正倒逼传感器技术升级,需在尺寸、功耗与画质间实现平衡,这正是SC1200IOT的核心价值所在。"