一种基于3G的驾驶员疲劳状态检测设计方案

发布时间：2012-02-21 阅读量：894 来源: 我爱方案网作者:

中心议题：
    * 视频采集及预处理
    * 基于肤色检测的人脸定位
    * 基于灰度信息的人眼定位
    * 基于Perclos 的疲劳识别
解决方案：
    * 通过DirectShow 技术对视频流抓取视频帧
    * 采用肤色聚性特征进行人脸定位
    * 采用Perclos 方法进行疲劳判断

疲劳驾驶是司机在驾车过程中介于意识清醒和进入睡眠的一种非正常状态，是导致交通事故的主要原因之一。由于车辆流动性强、任务区域广、安全隐患多、风险责任大，并缺乏科学有效的监管手段，近年来疲劳驾驶所造成的车辆事故时有发生。通过3G 视频监控系统对驾驶员面部状态的实时监控，一旦发现驾驶员眼睛疲劳状态立即进行报警，能有效减少驾驶员疲劳所造成的交通事故，解决车辆管理中"看不见、听不着、控不了"的难题。

基于3G 视频的疲劳检测主要包括视频流解压抓帧、人脸定位、人眼定位追踪和疲劳判断4 个部分。文中提出一种基于肤色检测及灰度信息的疲劳检测算法，能有效用于3G 车辆视频监控系统。

1 视频采集及预处理

文中使用车辆内部的3G 视频监控装置来进行视频采集，位于驾驶员头顶正面上方，拍摄在驾驶过程中多种光照环境下、不同姿势和精神状态的驾驶员视频。

视频预处理主要采用DirectShow 技术进行视频流解压抓帧。利用DirectShow 的媒体监测器对象（ MediaDetector Object） ,将拍摄到的驾驶员视频文件进行视频流解压缩，实时在线地从视频流中提取指定的帧视频图像，并为后续的驾驶员眼睛状态检测提供位图数据。

媒体监测器不仅能获取媒体源文件的格式信息，也可以通过捕获过滤器从一个媒体文件的视频流中捕获一幅位图图像，通常获得的位图是24 位RGB 格式。通过搜索媒体文件，媒体监测器可以获得这个文件中任意点的图像。应用程序通过调用IMediaDet 接口与MediaDetector 进行交互。接口包含了一些方法能够从媒体源文件中提取重要信息，比如媒体类型、帧速率甚至是视频流的单个帧。媒体监测器将过滤器视图封装到对象中，从而使应用程序屏蔽掉与视图相关的一些细节。

在疲劳检测中，用得到的第一幅图像检测人脸和眼睛，如若失败则从下一幅图像检测直至成功，并将得到的眼睛图像作为动态模板对以后的序列进行眼睛追踪，若失败则重新定位人眼。

2 基于肤色检测的人脸定位

肤色是人脸最为显着特征之一，对于彩色图像，肤色是图像中相对集中、稳定区域。肤色信息可将人脸和背景区域分开。研究表明，在除去亮度的色度空间中，不同人脸肤色分布具有聚类性。所以肤色的差异主要取决于色彩信息，而非亮度信息。基于肤色检测方法利用人的肤色中Cr和Cb的聚类特性，在YCbCr色彩空间中检测图像中是否存在人脸。这种算法检测速度快，并且受人脸旋转或侧转的影响较小。

肤色分割可以采用的色彩空间有很多种。其中YCbCr色彩空间具有与人类视觉感知过程类似的构成机理，能很好地反映肤色分布，并反映出肤色聚类特性。YCbCr模型与RGB 模型的变换公式如下：

通过对人脸数据库中和人脸视频图像中黄种人人脸肤色点的采样进行分析，可得到实验环境下肤色在YCbCr空间中的聚类，用数学表达式确定肤色范围的方法进行肤色建模。可根据Chai 采用YCbCr颜色空间的CbCr平面，如果某像素点的颜色落入Cr =[133∶ 173]和Cb =[77∶ 127]范围内，就认为是属于肤色像素，否则就认为是非肤色像素。确定为肤色区域后，将其认定的肤色区域的R、G、B 值均设定为255,在图像中显示为白色；非肤色区域设y = R = G = B = 0,即在图像中显示为黑色。随后对得到的图像采用自适应阈值二值化。

式中，g（ t）为灰度值为t 的像素个数； G 为非零像素个数。最后利用投影技术及头部的特点确定人脸上下和左右边界。由于眼部处于人脸上半部分，故只需保留图像的3 /5.

3 基于灰度信息的人眼定位

眼睛区域与周围区域相比，具有灰度值较低且灰度变化率较大的特点。因此可基于眼睛图像的灰度信息进行定位。

3. 1 眼睛粗略定位

准确定位人脸后，根据面部器官分布，人眼在脸部的上半部，可以很简单的确定一个大概区域。观察人脸图片，发现眼部在水平方向经过皮肤、左眼眼白、左眼瞳孔、左眼眼白、皮肤、右眼眼白、右眼瞳孔、右眼眼白、皮肤、灰度变化较大。在灰度变化突变处进行微分，将产生高值，将其绝对值累加，则灰度变化越大的那一行，累积值越大。计算公式如下：

f（ x,y）为得到的人脸区域的灰度图像，通过实验发现，在眼睛处导数变化值之和的绝对值最大，通过此方法可粗略判断人眼所在线的位置。

3. 2 人眼精确定位

通过观察发现眼睛周围Cb值较高，而Cr值较低，因此由式（ 5）计算得到特征图，以突出眼部特征。

其中，EyeMap 是眼睛特征图，（ Cb） 2,（ Cr） 2,（ Cb /Cr）都归一化到[0,255]之间，Cr是由Cr求反得到（ 255,Cr） .在得到EyeMap 图后，设定阀值T,将EyeMap 小于T 的值设为0,这一步可视为一个简单的滤波以去掉非眼部特征的干扰。

得到EyeMap 滤波图后，结合人眼粗定位结果，从左到右搜索，按比例定义相对于人脸区域一定大小的框，当框进EyeMap 滤波图值的和最大时，即为人眼。

3. 3 眼睛的追踪

对人眼完成定位后，还要利用动态模板匹配的方法跟踪眼睛。设眼睛模板左上角的位置为（ x,y） ,下一帧的搜索范围是原位置上沿上、下、左、右4 个方向各扩展10 个像素。其公式为：

式中，N 是模板中像索的个数； M 为模板； I 为图像中待匹配的部分。

可得所有大于阈值p 的最大值所对应的坐标为最匹配的位置。以此得到的眼睛图像作为下一帧图像的模板。在追踪的过程中，若得到的p 均小于阈值或两眼的行距过大则重新回到眼睛的检测过程。

4 基于Perclos 的疲劳识别

文中的疲劳识别基于Perclos 的P80 模型，即将闭合程度大于80%的眼睛状态判断为闭合状态。以初始时刻司机清醒时的上下眼睑最大距离为标准，若以后得到的距离小于此距离的80%则判断为闭合。假设实验视频帧率10 f·s - 1,分辨率为640 ×480,时长60 s.

则以每6 s 视频作为1 个检测单元，间隔0. 33 s 取1帧作眼睛状态检测。统计每个检测单元内18 帧图像的状态，得到眼睛闭合帧数CloseFrame_Num 和处理的总帧数SumFrame_Num,依据式（ 7）计算相应的Perclos 值。

如果所得Perclos 值大于实验确定的阈值20%,则判断此时驾驶员可能已处于疲劳状态，通过报警系统进行警告。

5 结束语

视频监控能对驾驶者进行监督提醒，有效预防疲劳驾驶，减少疲劳驾驶所引起的车辆事故。3G 视频监控是车辆监控发展的新趋势。算法在3G 监控视频帧的基础上，进行了人脸定位、人眼定位与追踪及疲劳状态判断。实验表明，该算法有较高的鲁棒性及准确性，并能有效应用于实际。

相关资讯

西部电子信息博览会启幕，聚力成渝打造世界级产业集群

7月9日，成都迎来第十三届中国（西部）电子信息博览会的盛大启幕。本届博览会紧扣“新动能、新生态、新西部”主题，在国家战略引领下，聚焦培育新质生产力，深化成渝双城产业协同，通过展示前沿成果、分享发展理念、促进生态合作，加速推动成渝地区电子信息先进制造集群向世界级跃升，倾力打造中国电子信息产业高质量发展的关键引擎。

解密伍尔特电子高温LED：PLCC封装实现100℃全彩照明方案

在工业4.0和智能制造的浪潮下，高温环境中的电子照明技术面临严峻挑战。传统LED在温度超过85°C时容易出现性能衰减、颜色漂移及寿命缩短等问题，限制了其在自动化设备、医疗仪器等关键领域的大规模应用。针对这一痛点，伍尔特电子（Würth Elektronik）通过创新研发，升级了其WL-SFTW SMT全彩高透明LED系列，引入全新RGB LED产品。这些器件将工作温度范围扩展至前所未有的-40°C至+100°C，显著提升了高温工况下的可靠性和色彩稳定性，不仅克服了行业瓶颈，还为工业、户外及特种场景开辟了创新空间。本系列产品的推出，标志着高温LED技术向高端应用迈进的里程碑，满足了对耐热、节能且可变色照明的迫切需求。

华硕高管谈关税不确定性对PC市场的冲击策略

华硕联席CEO许先越近期发表了关于美国对中国台湾地区关税政策影响的评论。他强调，当前美国对台湾关税的税率尚未正式公布，华硕已探讨了多种应对预案，但最终策略调整将取决于税率的具体确定。因此，公司目前采取“观望”态度，暂不进行重大行动。许先越指出，这一不确定性结合汇率波动，使得2023年下半年全球PC市场的走势难以准确预测，公司将密切监控外部环境变化。

重塑格局受阻？中芯收购Imagination GPU部门传闻遭多方否认

近日，一则关于“中芯国际以5.6亿美元收购英国Imagination Technologies GPU IP部门”的消息在部分自媒体平台流传。传闻称交易已于7月6日公告并获中欧监管部门批准，引发广泛关注。然而，经多方核实与权威信息查证，该传闻纯属虚假。

六九冗余架构问世！IBM Power11重新定义企业服务器可靠性标准

2025年7月，IBM正式发布Power11服务器系列，这是该产品线五年来首次架构级革新。据IDC研究显示，全球企业面临AI转型与混合云部署的双重压力，到2028年将新增10亿个逻辑应用。在此背景下，Power11通过颠覆性设计解决了高可用性、AI集成和网络安全的协同难题，为金融、医疗等关键领域提供新一代数字基座。