【热议】云视链的“读眼”技术那么好实现?

发布时间:2015-07-30 阅读量:808 来源: 我爱方案网 作者: 黄通兵

【导读】“Google研发7年无果,但他做到了”一则报道,把金证济苍和云视链炒的热火朝天,但好景不长,网友很快扒出其团队成员照片只是盗图,查不到金证的哈佛学籍,而在他声称加入的哈佛ilab上,也没找到一丁点云视链的记录。那些要颠覆视频行业和广告行业的技术也在好几年前就找到了先例。甚至金证这个复姓,都透着一股子作的气质...那么这一切,全都是泡沫?

近两天整个科技圈都被云视链霸了屏,又是一个青年才俊创业的励志故事,22岁就拥有哈佛大学高材生、创业公司CEO、6亿估值、福布斯创业榜单最年轻创业者等诸多光环,而透过这些光环我们该看一看云视链是否真的有看起来那么cool。

看看媒体是怎么说的吧:

扒皮云视链:“读眼”技术那么好实现?

抛开用户在观看视频过程中是否愿意那么多的互动(广告)不说,今天主要探讨一下,一听就觉得吊炸天的通过捕捉眼球信息来实现观众情绪和思维在视频中的实时反馈互动。

作为眼球追踪行业的从业者,我的分析可能让很多刚刚有点兴奋的读者失望了,从报道中所提到的云视链的技术来看,通过普通家用摄像头捕捉人眼注视点可是没那么容易实现的!

1、技术现状

目前在世界范围内眼球追踪技术的实现主要是通过眼电图法、巩膜接触镜法、眼图录像法、角膜反射法。

扒皮云视链:“读眼”技术那么好实现?

眼电图法应用较早,它是通过放置于眼镜附近的电极测量皮肤的电势差,实现眼动测量。

眼电图法在40年前就已经广泛应用,至今仍有部分领域使用此法测量。

巩膜接触镜法是将光学部件置于一个接触镜上,并将接触镜轻置于眼球上,这种方法在5°范围内可以达到5“~10”的精度,因此也是被认为精度最高的眼球追踪法。但是因为操作精度高,并且对于人眼有一定的伤害因此并未广泛应用。

以上两种方法普及性太差,对于普通用户来说根本无法实现。

眼图录像法主要是通过辨认眼球的特征如瞳孔外形、异色边缘(虹膜、虹膜边界)、近距指向光源的角膜反射来实现眼动跟踪。

根据云视频的宣传,其所提到的能够读懂人“眼神意识”的视频技术,就是基于此项技术,也就是眼图录像法。

2、技术实现的硬伤在哪里?

然而虹膜识别+瞳孔运动识别虽然可以捕捉人眼的动作,但是却无法检测到人眼的注视点,这才是最大的硬伤!

首先,虹膜识别和瞳孔识别都是基于一个平面的,要测量注视点就必须保证头部是固定的,让眼睛同头部和注视点的相对位置一致才可以。人眼作为人体最精细的器官之一,注视点转移仅需要一个微小的动作,而人类仅仅因为呼吸而造成的头部动作就足以让测量误差造成定位偏移。

然后我们再退一万步讲,即使的头部是固定的,对于虹膜的识别也没那么容易,欧洲人的人眼特征较为明显,识别相对容易,但也不是一个家用普通摄像头就可以判断眼球特征的,而亚洲人瞳孔多为深褐色,人眼特征较弱,普通摄像头几乎无法捕捉。

因此从云视链的眼球追踪技术的出发点来说,通过眼神就能推送出你想要的信息是无法实现的!

那么,云视链的视频与观众眼神关注点的实时反馈也是根本无法实现的吗?其实并非如此。

刚也已经提到,云视链以虹膜识别+瞳孔运动识别为出发点的,就是这个起点让他们走错了路。不知道有没有细心的读者注意到,其实眼球追踪技术的实现还有一种方法我没有说?那就是角膜反射法。接下来就介绍一下这种可以通过普通摄像头即可捕捉人眼注视点的方法,搬好板凳,买好瓜子。

角膜反射法是目前眼球追踪领域被广泛认可并应用的方法,主要通过摄像头捕捉人眼特征,通过算法建立人眼二维或者三维注视点估计模型,通过算法判断人眼动作和注视点。

眼球的特殊构造会形成一到多个浦肯野像,基于这种方法的眼球追踪一般定位第一浦肯野像,通过定标步骤,可以测量出在垂直平面现实定标点表面上人眼的注视点。

来张示意图看看:
扒皮云视链:“读眼”技术那么好实现?

为了从头部运动中区分眼球动作,需要眼球上的两个参考点。这种瞳孔中心与角膜反射之间的位置差异之随眼球转动而变化,同轻微的头部运动相对恒定,不管瞳孔在眼眶中如何转动,浦肯野像同眼球相对固定。目前我在七鑫易维了解到的眼球追踪算法,已经做到了头部的正常动作不影响注视点的判断,并且采用红外弱光进行弥补了亚洲人人眼特征不明显的问题,可以很精准地捕捉到人眼的注视点。可以说,这样的技术已经不是问题。
扒皮云视链:“读眼”技术那么好实现?

根据大脑——眼睛一致性假设,人们所看的一般是其大脑中正在处理的内容,这是人类视觉系统的工作方式。基于这个假设,采用眼动跟踪技术来研究人类心理已有近百年的历史。在人机交互过程中,注视等同于注意力。

所以说云视链的“读眼神”完全可以实现,但是路径要正确。

以“眼神推荐系统”为例。

首先,根据角膜反射技术及相关算法,完全可以捕获到用户的注视点。接下来,可以对用户的注视目标进行模式识别(例如,识别出他注视的形状是一个红色的女士手提包)。进而可以根据用户的浏览记录提取一些框架信息,比如,用户看的都是红色、细带的手提包,并且注视点经常停留在包的发行时间上,可以推断这个用户目前就是想买一个红色的细带手提包,而且很关注它是不是新上市的潮流产品;可以通过分析瞳孔直径的变化,推断用户的情绪。

在以上三点的基础上,完全可以给用户实现精准推送,匹配某宝、某东的物品给用户。这和很多购物网站上的“猜你喜欢”之类的标签某种意义上原理是一致的,不过过去只能通过分析用户点击、分析购物车等操作才能记录喜好,现在只要一个眼神。从对用户认知的把握与实现简易程度两个层面来讲,可以说,眼动跟踪技术产生的数据非常宝贵,且是其他输入通道所无法替代的。

扒皮云视链:“读眼”技术那么好实现?

对于眼球追踪技术方面产业链,国内目前有很多,而真正实现技术突破的并不多,这也导致国人对新技术狂欢。但是,反观眼球追踪方面的突破给特定人群带来的希望也很励志,比如“中国的霍金”王甲用眼睛写出了两本书,渐冻人“好想飞”也用眼睛打字开起了网店。这些都是技术带来的美好。

扒皮云视链:“读眼”技术那么好实现?

视觉在人类获取信息渠道所占比例超过80%,注视点信息就是视觉信息中最重要的,眼球追踪技术会给很多行业带来翻天覆地的变化,也会孕育出新的伟大公司,但绝不会是没有核心技术的忽悠型公司。

相关阅读:

“穿”是可穿戴设备的终极目标吗?

无人机锂电池行业标准发布 哪些企业将获益?

为什么富士康做得出全球热卖的苹果却量产不了锤子
相关资讯
半导体产业升级战:三星电子新一代1c DRAM量产布局解析

在全球半导体产业加速迭代的背景下,三星电子日前披露了其第六代10纳米级DRAM(1c DRAM)的产能规划方案。根据产业研究机构TechInsights于2023年8月22日发布的行业简报,这家韩国科技巨头正在同步推进华城厂区和平泽P4基地的设备升级工作,预计将于2023年第四季度形成规模化量产能力。这项技术的突破不仅标志着存储芯片制程进入新纪元,更将直接影响下一代高带宽存储器(HBM4)的市场格局。

蓝牙信道探测技术落地:MOKO联手Nordic破解室内定位三大痛点

全球领先的物联网设备制造商MOKO SMART近期推出基于Nordic Semiconductor新一代nRF54L15 SoC的L03蓝牙6.0信标,标志着低功耗蓝牙(BLE)定位技术进入高精度、长续航的新阶段。该方案集成蓝牙信道探测(Channel Sounding)、多协议兼容性与超低功耗设计,覆盖室内外复杂场景,定位误差率较传统方案降低60%以上,同时续航能力突破10年,为智慧城市、工业4.0等场景提供基础设施支持。

财报季再现黑天鹅!ADI营收超预期为何股价暴跌5%?

半导体行业风向标企业亚德诺(ADI)最新财报引发市场深度博弈。尽管公司第三财季营收预期上修至27.5亿美元,显著超出市场共识,但受关税政策驱动的汽车电子产品需求透支风险显露,致使股价单日重挫5%。这一背离现象揭示了当前半导体产业面临的复杂生态:在供应链重构与政策扰动交织下,短期业绩爆发与长期可持续增长之间的矛盾日益凸显。

全球可穿戴腕带市场首季激增13%,生态服务成决胜关键

根据国际权威市场研究机构Canalys于5月23日发布的调研报告,2025年第一季度全球可穿戴腕带设备市场呈现显著增长态势,总出货量达到4660万台,较去年同期增长13%。这一数据表明,消费者对健康监测、运动管理及智能互联设备的需求持续升温,行业竞争格局亦同步加速重构。

RP2350 vs STM32H7:性能翻倍,成本减半的MCU革新之战

2025年5月23日,全球领先的半导体与电子元器件代理商贸泽电子(Mouser Electronics)宣布,正式开售Raspberry Pi新一代RP2350微控制器。作为RP2040的迭代升级产品,RP2350凭借双核异构架构(Arm Cortex-M33 + RISC-V)、硬件级安全防护及工业级性价比,重新定义了中高端嵌入式开发场景的技术边界。该芯片通过多架构动态切换、可编程I/O扩展及4MB片上存储等创新设计,解决了传统微控制器在实时响应能力、跨生态兼容性与安全成本矛盾上的核心痛点,为工业自动化、消费电子及边缘AI设备提供了更具竞争力的底层硬件方案。