纪然团队运用无人机物体识别追踪技术在创新应用和实验取得成功
纪然是优秀的人工智能技术开发领域人才,在机器学习技术、深度学习和分布式计算、神经网络解释方法等领域有突出表现。擅长自然语言处理和利用机器视觉对照片视频进行智能分类和推荐回复,对深度学习技术的发展现状、具体应用和发展趋势等有独到见解。擅长基于卷积网络的的高效率图像识别软件,分布式人工智能物体追踪系统的开发。
在计算机视觉领域,物体识别算法框架的发展已趋于稳定,目前的计算机视觉已能够应用于大部分场景。无人驾驶飞行器(Unmanned Aerial Vehicle,UAV)是一种兼具飞行、垂直起降等功能,具有较好机动性的小型机器人,在融合计算机视觉技术后,广泛应用于无人机导航、定位着陆、飞行避障、视觉同步定位与建图(Simultaneous Localization and Mapping,SLAM)等方面。无人机物体识别追踪技术利用无人机作为载体,结合计算机视觉技术,在飞行过程中结合飞行高度与视角,提取目标物体图像特征并对特征信息进行处理,同时结合相对位置控制算法,实现追踪功能。
资料图人物: 纪然
纪然融合计算机视觉领域与机器人领域技术,提出飞行器在目标识别追踪过程中的一种优化模型。该模型改进了飞行器在目标识别追踪过程中的视觉估计误差匹配精度,达到了更好的人机交互效果。
为了验证该模型的准确性,纪然在实验中使用四旋翼飞行器AR.Drone Parrot,由于该飞行器体积小、质量较轻,并且有泡沫机身保护,因而可以很好地应对个人实验项目。在硬件设施上,该无人机配备有三轴陀螺仪与加速度计、超声波高度计、气压传感器和磁罗盘。此外,其包含两个摄像头:飞行器前部有带 90°角镜头的摄像头,分辨率为1 280 ×720像素,采样频率为30 fps,用于对实时视频流与图像进行记录;飞行器底部有一个微型摄像头,分辨率为320× 240像素,采样频率为15 fps,可用于估算水平光流速度。飞机本身嵌入Linux系统,因此可通过WiFi使飞行器与手机等电子产品进行交互。但该飞行器的软件和硬件都采用封闭式架构,需要使用一台装配 ROS 操作系统的PC作为上位机,通过上位机各模块节点实现对下位机驱动程序的控制。
纪然接下来进行视觉对象识别与跟踪的设计与试验。物体识别算法实验过程中飞行器正前方摄像头以 BGR 格式、30Hz速率传输图像,通过上位机中的 OpenCV 库进行视频流分析,并使用内核为 5×5 的模糊滤波器对图像进行平滑处理,实现降噪功能,从而减少因高频噪声引起的误报检测次数。同时,使用直方图均衡化改善图像对比度。ROS系统调用OpenCV库中的Haar 分类器对目标进行识别,并通过卡尔曼滤波器选择跟踪识别目标。如下图:
纪然提出的卡尔曼滤波器选择跟踪识别目标路程图
在目标追踪模型构建时,为了增强算法对抗遗漏检测的稳健性,以及在离散时间内的类似场景都能识别出训练过的目标对象,纪然在目标追踪分类器上使用卡尔曼滤波器。随着离散时间的增加,线性算子则会作用在当前状态上,产生一个新的状态,同时会带入一些噪声,并且系统一些已知控制器的控制信息也会被加入。本次控制算法基于真实实验模拟场景,见下图。
真实实验模拟场景图
为了保证飞行器在目标追踪过程中有良好的自适应性和鲁棒性,获得完整的目标状态信息反馈,需要飞行器在飞行过程中对目标物体保持恒定距离。纪然将飞行器相对位置控制转换成具有时变参考的三维位置控制,使用PD 位置控制器对控制回路进行补偿。
最后,纪然进行实验与分析。在计算机视觉算法融合结果分析中,针对计算机视觉算法融合结果的分析,是指在卡尔曼滤波控制飞行器位姿基础上,融合标的视觉算法结果进行分析。Haar 级联分类器对目Haar 级联分类器可以预先训练目标识别权重,卡尔曼滤波则有助于过滤识别的错误目标,从而提高系统运算速度,并使其具有较好的鲁棒性。而在计算机视觉估计误差结果分析中,在离散时间内,飞行器基于自身姿态相对位置估计误差值比较稳定。对实验数据进行处理后可以得出,在x、y、z 3个方向上,相对位置估计均方根误差的实验结果分别为0.124 5m、0.243 7m和0.176 8m。纪然及其团队提出的飞行器目标识别追踪算法在实验中表现出良好性能,不论是在室内还是室外环境中,飞行器都能较好地应对外界噪声,证实了系统的有效性、自适应性与鲁棒性。
纪然及其团队基于一种能够搭载ROS系统的飞行器实现目标识别与追踪功能。硬件设备使用AR.Drone与一台装配了ROS机器人系统的上位机,通过上位机节点通信功能实现对飞行器的控制以及物体识别与追踪。在计算机视觉算法中,目标识别可通过Haar级联分类器加以实现,同时调用卡尔曼滤波追踪被标记的目标。在飞行器追踪过程中,通过PD控制模型使飞行器在离散时间内完成与目标物体的相对位置调节,最终完成状态反馈。未来希望能够在本实验数据基础上,通过融合机器人及计算机视觉领域相关技术,进一步改善人机交互过程,使智能机器人能够更好地服务于人们的生产和生活。图文(作者:王小芳)