登录

/

注册

首页 > 科技媒体 > 媒体详情
清华电子系马惠敏研究组:在自动驾驶物体检测国际评测中获佳绩
梅西 2015-12-12
导语

近年来,借助智能系统实现汽车的自动驾驶成为科技届和产业界关注的热门领域。目前已经有处于实验阶段的无人驾驶汽车进行路测,而向驾驶员提供的智能辅助驾驶功能更是愈加丰富。对于这些车载智能系统来说,如何判断机动车、非机动车、行人混行的复杂路况,并作出对车内乘员和车外物体最为安全的驾驶判断,是至今仍在探讨的关键问题。

      近年来,借助智能系统实现汽车的自动驾驶成为科技届和产业界关注的热门领域。目前已经有处于实验阶段的无人驾驶汽车进行路测,而向驾驶员提供的智能辅助驾驶功能更是愈加丰富。对于这些车载智能系统来说,如何判断机动车、非机动车、行人混行的复杂路况,并作出对车内乘员和车外物体最为安全的驾驶判断,是至今仍在探讨的关键问题。可以说,解决这些问题最关键的技术是视觉感知,即如何通过计算机来自动识别物体。

      为了评测目标(机动车、非机动车、行人等)检测、目标跟踪等计算机视觉技术在车载环境下的性能,德国卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合建立的一个算法评测平台KITTI,成为目前国际上公开的最大的自动驾驶场景下的计算机视觉算法评测数据集。不久前,清华大学电子系副教授马惠敏率领的三维图像团队在KITTI国际评测中取得了优异的成绩,全部六项指标中的四项获得第一,两项获得第三。参加评测的还有来自百度公司、NEC美国研究院、斯坦福大学、加州大学洛杉矶分校、马克思·普朗克研究所(MPI)等机构的团队。


      在物体检测这一竞赛项目上,参赛者使用计算机视觉算法检测出由车载相机所拍摄的城市街道上的车辆、行人和自行车,并且估计出它们的姿态朝向。用于性能测试的KITTI数据集包含了7千多张车载图像,单张图像上尺度不同的车辆数目最多可达十几辆,因此部分车辆会被其它车辆遮挡,而且远处的车辆在图像中尺度非常小(最小高度只有25像素),检测难度非常大。马惠敏研究组和多伦多大学合作提出了一种高效的三维物体提取方法,并结合深度卷积神经网络,依据立体图像推断场景中物体的位置和姿态。和传统的基于昂贵的激光雷达的自动驾驶识别算法不同,该研究组的算法仅依赖于普通的双目RGB摄像头即可完成高精度的目标检测和姿态估计,因此有望大大降低自动驾驶视觉系统的成本。他们的相关论文也已发表在机器学习与神经计算的顶级会议NIPS上。


马惠敏副教授简介:

清华大学电子工程系副教授,博士生导师,三维图像仿真研究室负责人,Email:mhmpub@tsinghua.edu.cn 

实验室主页:http://3dimage.ee.tsinghua.edu.cn

研究领域:

(1) 三维图像识别:研究“从不同观测角度看物体时,物体形状发生变化”的图像识别问题,实现任意视点下的三维物体识别。

(2) 三维系统仿真:研究“真实世界中的跟踪与逃避、识别与隐藏的复杂对抗关系”的三维系统建模与仿真问题,实现干扰环境下的目标识别与跟踪。

(3) 图像心理学:研究“不同的人看到同样的图像,会产生不同的反应”的图像心理学问题,利用人的图像认知过程,实现人的心理特征的量化测量。

研究概况:

(1)三维物体形状识别

任意视角下的三维物体识别可以用于大数据库中物体/图像检索和自动视觉导航,具有很大的难度,在我们的3D物体形状识别与图像检索研究中,从物体的 不同观测视点出发构建了一个描述其空间结构的图的模型,在普林斯顿大学三维形状标准库上测试,取得了很好的结果。我们还设计了一个利用单摄像头采集真实环 境中物体图像并进行检索识别的系统。

任意视角三维物体识别系统,以及用于识别的部分物体

(2)三维图像系统仿真

真实世界中,多个目标之间存在非常复杂的相互作用,我们通过建立物体的三维模型和物理模型模型,研究识别算法和跟踪算法,利用计算机虚拟现实技术实现对这些复杂系统的三维仿真,以实现在干扰情况下的三维目标识别与跟踪。

焰火仿真、船和干扰仿真、飞机和干扰仿真

(3)基于图像认知的心理学

人的心理因素在图像认知中有重要的影响,但是利用计算机自动获取、量化分析人的心理特征是一个具有挑战性的难题。在我们的图像心理学研究中,基于明 尼苏达量表等建立了一个具有心理语义的图像测试样本库,利用反应时间、眼球运动跟踪等对典型的心理特征进行测量和分析,取得了一些初步的研究成果。我们还 建立了一个基于图像的心理分析系统来提取人的心理特征,并研究人的图像认知机理。

基于图像的心理分析系统,在图像认知实验室中的测试

主要研究项目:

(1) 用于三维目标识别的形态图理论和方法研究,国家自然科学基金,2006-2008

(2) 三维系统仿真及图象识别与跟踪处理器设计,国家专项系列项目,2002-2013

(3) 基于图像认知的心理学研究,清华大学国家实验室基金项目,2009-2010

(4) 基于图像认知的人的心理特征的提取与分析,国家自然科学基金,2012-2015

奖励与荣誉:

(1) 2006年,获“清华大学教学成果二等奖”

(2) 2004年,获得“清华大学优秀班主任一等奖”

(3) 2003年,被评为“清华大学校级工会积极分子”

(4) 2002年,获得部级三等奖,排名第三

(5) 2002年,获得一项专利(99118014.3),排名第三

(本文整理自清华大学网站http://www.tsinghua.edu.cn/

如若转载,请注明e科网。

如果你有好文章想发表or科研成果想展示推广,可以联系我们或免费注册拥有自己的主页

  • 清华
  • 马惠敏
  • 自动驾驶
  • 物体检测
分享到
文章评论(0)
登陆后参加评论
作者 梅西

本科生

北京工业大学

活跃作者
  • 爱因斯坦 科研工作者 北京航空航天大学 博士
  • 金陵 本科生 北京大学 本科
  • 梅西 本科生 北京工业大学 本科


发布成功!

确 定 关 闭