六自由度平台视觉引导系统实验工作原理概述-云顶国际app

400 025 3599
云顶国际app
全控简介
模拟平台
云顶国际app的产品中心
荣誉资质
新闻资讯
云顶国际app的招贤纳士
联系云顶国际app
电话咨询
400 025 3599
返回顶部
当前位置: 新闻中心 > 技术文档 >
六自由度平台视觉引导系统实验工作原理概述
发布时间:2023-10-09 13:45:43

  六自由度平台视觉引导系统基于多目立体视觉技术,采用多相机组合实现反光标记点的检测以及对接对象目标位姿的检测与输出,多目立体视觉技术在机器人对接引导系统中的应用涉及使用多个相机或视点来检测和追踪靶标的位姿,以协助机器人在对接过程中实现精确的定位和对准,该技术允许机器人识别和跟踪目标靶标的位置和姿态,从而实现安全和准确的对接操作。

  多目立体视觉系统使用多个摄像头或相机来同时捕获目标靶标的图像,这些相机可以布置在不同位置和角度。这样,系统可以获得丰富的图像信息,从不同视角观察靶标。在每个摄像头的图像中,多目立体视觉系统会提取靶标上的标志物特征点,这些特征点按照特定的方式排列安装。然后,系统会尝试将这些特征点在不同图像之间进行匹配,以进一步确定该标志物特征的空间三维信息。随后根据标志物特征点特定的排列规则和空间位置关系进行靶标位姿估计。通过匹配特征点和空间位置关系计算,系统可以估计靶标的位姿,包括其位置和方向,该位姿信息将用于引导机器人正确对准目标。以下为该多目立体视觉引导系统具体工作原理及流程概述,其主要工作包括以下几部分:相机的架设与调试、多目相机扫场标定、定位相机系统参考坐标系、靶球位置检测以及目标位姿计算。

  (1)相机的架设与调试

  采用四个相机的多目立体视觉系统中,相机的架设可以根据实际应用场景进行调整,采用特定的架设方式,通常采用四边形布局架设相机,如图1 所示,设备安装实物图如图2所示,以确保最大程度覆盖目标区域并获得多角度的视图。将四个相机以平面布置在目标区域的不同位置,相机可以均匀分布在一个平面上,也可以根据需要分布在不同的高度和角度,这样可以获得多个视角的信息,有助于提高位姿检测的准确性和鲁棒性。但每个相机所拍摄的画面应该具有一定的重叠区域,以确保目标对象在两个以上不同相机之间存在共同可见的区域,以便进行立体视觉匹配,重叠视野有助于提高立体视觉匹配的成功率,特别是对于复杂的场景。其中标记球无需同时被四个相机所检测到。

  多相机系统需实现同步拍摄,确保四个相机能够在相同的时间点拍摄图像,以避免时间差引起的视差问题。通过一个工控主机实现外部的触发同步系统来确保相机同时触发快门,同时通过工控机实现与处理器和机器人系统的交互,系统构成如图3所示。

  另外,需确保相机之间的相对位置和朝向是已知的,这需要进行精确的相机扫场标定过程来实现,以获得准确的相机参数。

图片1

1 相机架设方式

图片2

2 设备安装实物图

图片3

3 系统构成

  (2)相机扫场标定

  机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。

  在图像测量过程以及机器视觉应用中,为确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,必须建立相机成像的几何模型,这些几何模型参数就是相机参数。在大多数条件下这些参数必须通过实验与计算才能得到,这个求解参数的过程就称之为相机标定(或摄像机标定)。无论是在图像测量或者机器视觉应用中,相机参数的标定都是非常关键的环节,其标定结果的精度及算法的稳定性直接影响相机工作产生结果的准确性。因此,做好相机标定是做好后续工作的前提。相机标定方法有:传统相机标定法、主动视觉相机标定方法、相机自标定法。

  此外,多目相机扫场标定(multi-camera scene calibration)是一种用于获取多个相机之间以及相机与世界坐标系之间的关系的过程。这个过程通常涉及到标定相机的内部参数(如焦距、主点位置、畸变系数等)以及相机的外部参数(位置和姿态)。

  相机模型:在多目相机标定中,通常使用针孔相机模型来描述相机的成像过程。这个模型包括相机的内部参数和外部参数。

  内部参数:这些参数描述了相机的内部属性,如焦距、主点位置、畸变系数(径向和切向畸变)等。内部参数通常在相机制造商的规格表中提供,但为了更准确的标定,可以使用标定板或校准目标来测量它们。

  外部参数:这些参数描述了相机在世界坐标系中的位置和姿态。它们包括相机的位置(三维坐标)以及相机的方向(通常使用欧拉角或四元数表示)。

  标定目标:在多目相机标定中,通常需要使用一个或多个标定目标,如一维标定杆、标定板或标定棋盘。这些标定目标上通常有已知的特征点,例如角点。这些特征点在世界坐标系中的位置是已知的,并且可以被用来计算相机的外部参数。通过以下相机成像模型和坐标系转换等原理进行单目相机标定,并通过基于一维标定物的多摄像机标定方法进行多相机统一标定。

  针孔成像模型:在计算机视觉这一学科领域的研究中,成像模型是指三维立体场景中的目标物体投影至像平面的成像关系,摄相机的成像模型是一种简化的光学成像模型,目前为止已有线性和非线性两种成像模型。针孔成像模型是一种基本成像模型,通常也称作线性模型,主要由光心、投影中心、成像面和光轴组成。实际的摄像系统通常都由透镜或透镜组构成,平行于主光轴的光线穿过透镜时,会聚到焦点上,焦点到透镜中心的距离即为焦距f,相机的镜头相当于凸透镜,感光元件就在这个凸透镜的焦点附近,将焦距近似为透镜中心到感光元件的距离就成为针孔成像模型,如图4所示。

   图片4


图4 针孔成像模型示意图

  坐标系转换关系:摄相机标定过程涉及到世界坐标系、相机坐标系、成像面坐标系以及像素坐标系之间的关系。

  (3)靶球位置检测以及目标位姿计算

  视觉引导机器人定位对接系统中,目标检测部分是关键的技术组成部分之一,它使机器人能够识别和定位目标物体,以便安全、精确地对接、导航或操作。目标检测是旨在从图像或视频中识别和定位特定对象的技术方法。位姿检测是实现对接目标位置与姿态检测的一个重要任务,它涉及到相机视觉系统、图像处理、坐标系转换等多个原理和步骤。

  双目视觉的工作原理来源于人类的双目视觉系统,也就是说从不同的视角通过两个相同的相机捕获同一个位置下的左右两侧图像,然后再利用三角测量原理获取物体的深度信息,通过这些深度信息重建出物体的三维模型。多目视觉是双目视觉的一种延伸,它是在双目视觉的基础上,增加一台或者多台摄像机作为辅助进行测量,从而获得不同角度下同一物体的多对图像。

  多目视觉法不需要人为地对相关辐射源进行设置,能够在不接触的情况下进行自动在线检测。这种方法的优点是可以减少测量中的盲区,获得更大的视野范围,更高的识别精度;此外,该方法还能解决双目视觉中的误匹配现象,能够适应各种场景。目前,多目视觉法在车辆自主驾驶、机器人视觉、多自由度机械装置控制等很多领域获得了广泛的应用。

  4)视差原理:

  视差法是进行深度计算、三维测量和三维重建的关键方法,通过计算不同摄相机抓取的二维图像对应点位间的视差,并根据视差法数学模型求解深度信息,进而可以实现三维测量的目的,由此即可根据三维测量获得目标点的三维坐标信息并进行三维模型重建。视差是指同一物体在不同视角下产生的像素位移。在双目视觉或多目立体视觉系统中,当相机位于不同位置观察同一场景时,同一物体在不同图像中的位置差异就是视差。这个差异可以用来估计物体的深度信息。视差的大小与物体距离相机系统的远近有关,距离越远,视差越小,距离越近,视差越大。

  视差法的第一步是计算视差图。它是一幅灰度图像,每个像素的灰度值表示该像素处的视差大小。视差图中的每个像素都对应于左图像和右图像中的一个匹配点。视差图的生成通常涉及计算左图像中的每个像素与右图像中可能的匹配点之间的匹配代价。常用的匹配代价度量包括绝对差异、平方差异、归一化互相关等。目标是找到在右图像中与左图像中每个像素最匹配的点。在计算视差图时,需要确定搜索策略,即确定每个像素在右图像中搜索匹配点的范围。通常使用的方法是在左图像中确定一个搜索窗口,然后在右图像中在一定范围内搜索匹配点。一旦得到视差图,可以将视差值转换为深度值。这通常涉及使用相机参数和基线长度等信息来执行逆三角测量。较大的视差对应于较近的物体,较小的视差对应于较远的物体。将深度值从视差图转换为深度地图,其中每个像素的深度值表示物体在空间中的距离。深度地图可以用于三维重建和物体识别。

  5)图像预处理与特征点提取:

  图像预处理和特征点提取是本系统中的两个重要步骤,目的是为了更好地分析图像并从中提取靶球信息。预处理过程主要包括图像滤波降噪、阈值分割以及形态学处理等操作。通过图像预处理过程,可以实现降低数据复杂性,原始图像可能包含大量的信息,包括噪声和不相关的细节。图像预处理有助于去除这些不必要的信息,从而降低数据的复杂性,使后续处理更加高效。同时可以消除图像噪声,图像通常受到各种类型的噪声干扰,如电子噪声、模糊和伪影。预处理步骤,如平滑和滤波,有助于减少或去除噪声,提高图像质量,并增强图像关键信息,有时图像中的靶球关键信息可能不够明显,或者受到光照变化的影响。图像预处理可以通过增强特定特征或区域,使其更容易检测和分析。

  特征点提取的目的则为定位二维图像中三个放反光标记点的二维位置坐标信息。通过轮廓提取、边缘检测以及亚像素中心点提取等操作步骤,获取靶球二维位置信息,以供后续特征点匹配并计算靶标空间位姿信息使用。

  6)特征点匹配与空间位姿计算:

  在不同相机采集的图像中,进行特征点的匹配。通过以下方法中的一种可以实现匹配。基于描述子的匹配:对每个特征点计算描述子,然后使用描述子之间的距离度量(如欧氏距离)来匹配特征点。基于最近邻:对于每个特征点,在另一个图像中找到最接近的特征点作为匹配点。可以使用k最近邻算法(k-nn)来实现。基于ransac的匹配:使用ransac(随机采样一致性)算法来估计两个图像之间的变换矩阵,以过滤掉错误的匹配点。本系统采用基于ransac的匹配,效率及准确率更高。完成基匹配过程后,通过以下方法确定匹配。阈值筛选:根据特征点之间的距离或相似性分数设置一个阈值,筛选掉不满足条件的匹配。几何验证:使用几何变换关系,如基础矩阵或本质矩阵,对匹配进行验证,并排除不符合几何约束的匹配点。本系统根据靶球设置安装的空间距离信息进行匹配筛选,如图12所示,最终确定匹配关系。

  最后,一旦确定了匹配的特征点,即可以使用三角测量、视差原理等重建标记球的三维信息,包括其在世界坐标系中的位置。图像处理操作均通过使用opencv计算机视觉库以及机器学习技术来实现。

关键词: 视觉引导系统
相关新闻
本网站所有内容未经授权,不得转载,违者追究相应法律责任! 法律声明

云顶国际app copyright (©) 2020 云顶国际app 备案号:
网站地图