精华内容
下载资源
问答
  • 机器人运动控制-水下机器人

    千次阅读 2020-08-28 22:59:58
    背景 水下机器人运动控制体系由三个部分组成数据处理部分、控制算法、推力分配 数据处理通过采用不同滤波方式,把从传感器传来...其中感知层包括环境危险感知避障、对水下机器人运动状态以及水下环境理解、对

    1背景

    水下机器人运动控制体系由三个部分组成数据处理部分、控制算法、推力分配
    数据处理通过采用不同的滤波方式,把从传感器传来的信息通过滤波处理、剔除野点来获取平滑数据,同时还可以根据位置信息推算出速度,加速度等
    控制算法部分,通过采用不同的控制器的设计来实现,获取水下机器人各个自由度上所需要提供的推力矩
    分配器包括将各个自由度的推力分配到每个执行器上以及执行器所发出的力与指令之间的转换
    在这里插入图片描述
    运动控制系统分为感知层、控制层以及执行层三层。其中感知层包括环境危险的感知避障、对水下机器人运动状态以及水下环境的理解、对于上层规划系统指令的分析、水下机器人的故障信息感知等。在控制层中,采用智能控制技术设计了水下机器人的运动控制器,研究神经网络与其它控制算法相结合的控制器结构和学习算法,探讨适应于水下机器人的运动控制理论。在执行层中,针对各种复杂的执行器系统,通过分析各种执行器系统的水动力性能,设计了合适的推力分配策略

    2PCE体系结构

    运动控制系统的体系结构分为三层,这三层不仅包含了软件体系结构,同时也包括了硬件体系结构,分别为感知层(preception layer)、控制层(control layer)和执行层(executive layer),简称水下机器人PCE运动控制体系结构。

    感知层是水下机器人获取外部知识以及目标指令的窗口,包括对水下机器人的系统资源、动力性能、周围环境以及目标指令的感知与理解。它依赖水下机器人搭载的各种传感器包括速度传感器、位置传感器、姿态传感器、定高传感器、流传感器等来获取水下机器人的运动信息以及水下机器人的周围环境信息,同时采用一定的滤波算法来处理水下机器人获得的原始传感器信息。另外针对各种上层结构如规划控制系统或者人为指令,感知层根据水下机器人当前的运动状态信息以及环境理解对目标指令进行理解,在综合考虑水下机器人运动能力的基础上提供信息给控制层。同时感知层具有对水下机器人自身和周围环境信息的理解能力,针对某些紧急、故障处理等行为,如果将指令下达给控制层后再驱动执行结构会导致指令的滞后,在这种极其危险情况下最重要的己经不是控制器的稳定性,而是水下机器人的安全问题,针对这些情况,感知层采用行为响应的办法直接操作和控制执行层的元件。

    控制层的作用是根据从感知层获得的运动目标信息、自身运动信息采用一定的算法来获取水下机器人各个自由度上执行结构所应该提供的推力,并将该推力指令发送给执行层,从而完成上层系统所规划或人为指定的各种目标路径

    执行层的作用是将控制层的推力分配到各个执行机构上,并驱动执行机构使其发出运动所需要的力。另外执行层也可以在不需要控制层参与的情况下,直接执行感知层的指令来应对各种紧急情况

    简要来说是控制层受到感受层信息作出控制算法,来驱动执行层。但是在危险和特低情况下,感知层可以直接操作执行层。

    在这里插入图片描述

    3感知层

    感知层技术包括环境与系统信息的获取与处理、知识的抽象与表达、联想与推理等,是外界事物在水下机器人“头脑”里的反映,是水下机器人对自身任务和系统环境的一种认知,通常分为离线感知技术和在线感知技术,而后者则是了水下机器人的自主能力和思考能力的体现。

    感知层技术是针对水下机器人运动控制系统体系结构来说的
    通过环境与运动状态感知、目标指令理解、系统性能感知三个方面来完善系统

    其中环境感知体现了水下机器人的非条件反射行为目标指令感知是水下机器人对于上层指令的分析理解系统性能感知是其对自身系统状态的认知,也是进行故障诊断的一个依据,使得水下机器人在发生故障之后能够采取合理的控制模式,保障水下机器人的安全或在安全的前提下完成任务。

    3.1水下机器人动力学模型

    有两个坐标系与水下机器人的运动有关,它们分别被称为大地坐标系和艇体坐标系。大地坐标系又被称为地球坐标系或惯性坐标系,它被定义为以地球表面上任意一点为原点的三个正交的轴,其中,X轴指向正北、Y轴指向正东、轴指向深度增加的方向,它们遵循右手定则.

    艇体坐标系定义在水下机器人上,它的三个轴分别是纵轴指向艇舷方向,横轴指向艇体的右侧,竖轴指向艇体的底部。

    3.2目标指令理解

    遥控水下机器人指令的通常是通过上位机与下位机的通讯由操作人员下达,预编程水下机器人则通过将水面控制机的控制台上编制好的程序直接下装到预编程水下机器人载体计算机中。遥控式水下机器人与预编程水下机器人相对而言都有具体操作人员的参与,因此操作人员的指令往往直接作为其运动控制系统的目标指令。而自主型智能水下机器人由于目标指令往往都是根据任务需要并通过分解任务获得的,通常都没有考虑到水下机器人当前的运动能力以及运动需求,正如在获得潜浮的目标指令时,如果不考虑当前水下机器人的纵向运动速度,则不能以最优的方式来实现潜伏运动。
    在这里插入图片描述
    简单来说操作人员可以发出简单指令和目标指令两种指令,其中简单指令机器人的理解系统接直接理解并作出动作,而目标指令需要通过规划系统和多机器人系统和其他智能体分解任务。指令理解系统对其理解并作出动作。例如过弯,需要声呐配合不停接受发送信息最后完成动作。

    4控制层

    其目的是根据从感知层所获得的运动目标信息、自身运动信息通过一定的算法来获得水下机器人各个自由度上执行机构所应该提供的推力

    在深水中、近海底或靠近障碍物时,其所受到的水动力各不相同。复杂的海洋环境有风、浪和流,对于深水航行
    的水下机器人来说,尽管风和浪一般不加以考虑,但海流的影响是很大的。总之,水下机器人是一个强非线性系统,而且考虑到运动的时变性、环境的复杂性和不确定性,建立精确的水下机器人运动模型是不可能的
    所以,水下机器人控制系统的设计必须考虑非线性问题和水下机器人运动耦合问题,同时从加强机器人的自主性与适应性,从改善水下机器人工作性能的观点来看,控制系统还应该具备良好的自适应与自学习能力
    在这里插入图片描述

    4.1神经网络搭建

    我们将目标规划器所获得的期望加速度作为控制网络的输入输入层、隐含层、输出层分别包含2个,6个,1个神经元.输出则是作用在水下机器人上的各个自由度上的力。为了保证控制网络的稳定性,在传感器由无数据到有数据状态变化的那个节拍自学习部分和实时部分的网络权值不进行同步更新

    5水下机器人执行层技术

    1针对不同推力器的布置方式造成的推力分配的复杂性,建立合理的推力分配逻辑

    2针对采用舵、翼等多种执行机构时,舵、翼等执行结构与推力器之间推力分配方案选择,以及在推力器与舵翼执行器之间相互转换时采取的处理方法

    3针对某个执行器出现故障情况时而执行器系统仍有冗余情况下的推力重新分配。

    6水下机器人运动控制系统

    在这里插入图片描述

    展开全文
  • 为了提高球形机器人的运动性能,将原地转向运动作为一种独立的运动方式,研究了一种双偏心质量块驱动球形机器人的原地转向运动控制方法。介绍了双偏心质量块驱动球形机器人的机构特点,利用达朗伯原理对机器人进行受...
  • 从小口径管内机器人的特殊应用场合出发,针对无流体管道工作环境,将小口径管内机器人按运动方式概括为轮式、蠕动式与振动式三种类型,以驱动源为分类标准详细介绍了各种小口径管内机器人的发展过程与研究现状,并对...
  • 双足步行机器人的ZMP与CoP检测

    千次阅读 2017-04-12 12:03:00
    当机器人做静态步行运动时,身体的各个部分运动速度很小,机器人的整体稳定性较易控制。静态步行稳定性采用机器人的重心地面投影点(Center of Gravity,简称CoG)作为稳定性标准,这种判定方法适用于运动较为缓慢的...
    • 静态步行与动态步行

      机器人步态分为静态步行和动态步行。当机器人做静态步行运动时,身体的各个部分运动速度很小,机器人的整体稳定性较易控制。静态步行稳定性采用机器人的重心地面投影点(Center of Gravity,简称CoG)作为稳定性标准,这种判定方法适用于运动较为缓慢的情况。如果机器人采用的是一种高速运动的步行方式,则称之为动态步行。当机器人进行动态步行时,其重心的位置和加速度的大小时刻都在变化,产生向前和侧向的惯性不容易控制,从而稳定性不好掌控。在机器人的静态步行过程中,如果重心投影的轨迹始终落在支撑面内,称之为稳定。当机器人保持静止或静态平衡时,其ZMP与重心在地面上的投影重合。当机器人步行速度较高时,由于惯性力,重心在地面上的投影点不能保证始终与ZMP重合。

    • ZMP(零力矩点)和CoP(压力中心)是评价双足步行机构行走稳定性的重要参数。

      双足步行机器人研究的一个关键问题是实现其稳定的行走。目前世界上大多数双足步行机器人系统都采用ZMP作为稳定行走的判据。ZMP是由南斯拉夫学者Vukobratovic提出的, 他研究了ZMP与双足动态系统之间的关系,提出ZMP是判断动态平衡的一个重要依据。ZMP是地面上的一点,重力和惯性力对这一点的力矩,其水平分量为零。即整个系统对于这个点的前向、侧向的倾覆力矩为零。他指出,当双足机构处于动态平衡时,ZMP和脚底所受地面反力的压力中心CoP是重合的。因此,我们可以根据检测到的地面反力信息,计算CoP,通过控制策略调整ZMP和CoP的位置,使二者重合,实现机器人的动态稳定行走。日本本田公司的机器人ASIMO通过安装在脚部的六维力/力矩传感器检测出地面反力信息, 计算得到CoP,通过独特的姿态控制同时调整躯干姿态和脚部姿态, 进而保持ZMP和CoP 在行走过程中始终处于合适的位置, 实现稳的行走。

      对于处于动态平衡下的双足机器人, 在单脚支撑期间内, ZMP与CoP是重合的。对于单脚支撑期的动态不平衡状态, 整个机器人机构围绕脚的边缘发生旋转或翻转, ZMP和CoP是不重合的。根据定义可知CoP是永远不会离开支撑区域的, 而ZMP可以离开支撑区域。(If the robot is dynamically stable ,ZMP coincides with CoP and can be calculated with CoP by using force sensors on the foot. If the biped is not dynamically stable ,the CoP can still be determined but this location does not represent the ZMP)。ZMP点由于计算比较容易,常用于行走步态的生成,而CoP则由于容易直接测量,更适合用于对机器人行走进行控制。ZMP作为机器人稳定行走的一个充分条件,使用范围有一定的限制:当足底打滑、地面不平、或者机器人上身与外界环境接触时,ZMP就不能应用

      当ZMP处于支撑区域之外时, 机器人就会倾倒。作用在机器人脚底的实际地面反力(包括垂直反力和摩擦力)作用点如能与期望ZMP重合,并落在支撑多边形内,则对于机器人无翻转力矩,处于稳定行走状态。期望ZMP可通过实际结构尺寸、重量、步态规划进行计算。实际ZMP需要由六维力/力矩传感器(或多个压力传感器)进行测量,传感器的最佳安装位置应在踝关节以下,越接近地面越好。

    • 支撑多边形

      支撑多边形是指机器人足底面和地面接触点构成的最小多边形;对于单腿支撑, 根据定义其支撑多边形就是支撑腿的足底接触面;对于双腿支撑可分两种情况, 一种为两腿都完全与地面接触(图2), 另一种是其中一条腿即将离地时(图3)。由图2 可知, 两腿足底完全接触地面时的支撑面为多边形ABCDEF , 当其中一腿即将离地时, 它的接触面变成一条线, 支撑面也会变成多边形ABDEF。根据支撑多边形和零力矩点ZMP的定义, 可得到零力矩点始终落在支撑多边形内而不能落到边缘之外, 这为机器人是否稳定行走提供了判断的依据, 即利用传感器检测ZMP的位置与支撑多边形边界进行比较判断行走是否趋于稳定;在一般情况下, 为了预先防止ZMP 坐落在支撑多边形边界上这一情况的发生, 通常距支撑多边形边界留出一段距离作为稳定裕度。

     

    • ZMP测量

      通过安装在足底的压力传感器测量各个离散点的压力,离散点的数量越多,ZMP的估计越准确。

       以上为单脚支撑期的实际ZMP的计算公式。在双足步行机器人的行走过程中,还有双脚支撑期。当机器人处于双脚支撑期时,每只脚的实际ZMP仍然用以上公式计算,整个机器人系统的实际ZMP可按下式计算,推导过程可参照图3所示。式子中X1、X2、Y1、Y2分别为左右脚ZMP点在参考坐标系中的坐标。Fz1、Fz2分别为左右脚4个压力传感器计算出的竖直方向的合力。

    • ZMP计算

      对于研究机器人步行运动,通常都是计算ZMP运动轨迹来反映步行的稳定性。通过重力与惯性力的合力来定义ZMP的坐标计算公式,并用达朗贝尔原理进行推导。(推导时注意坐标轴以及力/力矩的方向)

      设机器人各个连杆质量为mi,连杆质心坐标为(xi,yi,zi),重力和惯性力的合力为:

      该合力对各个坐标轴的矩为:

      将合力从参考坐标系原点移动到ZMP点,ZMP点处合力矩对X,Y轴分量为零,则有:

      可求得:

      不考虑惯性力的影响,则上式变为:

      忽略惯性力的影响后,ZMP与CoG(重心在地面上的投影)重合。由此可见,静态步行为动态步行的特例。

     

     

    参考:

      1. 刘莉,汪劲松,陈恳,杨东超,赵建东. 基于六维力/力矩传感器的拟人机器人实际ZMP检测[J]. 机器人. 第23卷第5期,2001年9月

      2. 常江. 基于ZMP 的双足机器人稳定性分析[J]. 佳木斯大学学报( 自然科学版). 第27卷第1期,2009年01月

      3. 林玎玎, 刘莉, 赵建东, 陈恳. 双足步行机器人的ZMP-CoP检测及研究[J]. 机器人. 第26卷第4期,2004年7月 

    展开全文
  • 四足机器人的运动控制是对各条腿电机进行联合控制。在MIT Cheetah之前,大家按照传统思路多采用位置或速度控制,能实现基本的步态。现在通常是结合人形机器人的研究成果,采用力控方式。 我们将控制研究的问题...

    四足机器人的运动控制是对各条腿电机进行联合控制。在MIT Cheetah之前,大家按照传统思路多采用位置或速度控制,能实现基本的步态。现在通常是结合人形机器人的研究成果,采用力控方式。

     

    我们将控制研究的问题进行模块化,层次化分析。通常四足机器人的运控分为上层规划和下层控制。举个例子,为了完成指定的某个动作(比如Walk步态行走),通过动力学模型解算得到支撑腿的脚底需要多大的力矩,然后将这个力矩通过雅克比矩阵映射到各腿关节生成力矩指令;同时使用位置规划计算得到摆动腿即将跟随的轨迹,同样使用雅克比矩阵映射到对应腿关节生成力矩或者位置指令,最后关节控制器执行。前面生成力矩指令、位置指令的过程就是上层规划,最后关节控制器的执行就是下层跟随。整个过程的理论依据就是力和力矩的平衡。

    MIT mini Cheetah和ETH ANYmal的控制结构。控制结构均分为上层规划和下层跟随两部分。在上层规划部分,MIT使用了的动力学方法,而ETH使用了深度学习。下层跟随两者均使用了PD控制器这个万年不变的神器。

     

    应用到足式机器人上的控制理论和方法在不断突破。Marc Raibert及其团队在足式机器人的运动形态上做出了多个效果。Marc Raibert将足式机器人的智能层次分为运动智能(Athletic Intelligence)和感知智能(Congnitive Intelligence)(出自视频:https://www.youtube.com/watch?v=yLtdzJ6mVMk&t=11s)。显然运控攻城狮关注的是运动智能。

     

    对于想从事足式机器人,特别是四足机器人运控的小伙伴,需要关注哪些内容呢?

     

    大体分为几个部分:建模、仿真、轨迹优化、控制。建模涉及到机器人学、关节机器人建模基础知识、浮动基动力学、参数辨识方法和实践等。建模包括简化的单刚体模型和复杂的多刚体模型,需要根据控制需求来决定。理论上,完美的动力学模型可以实现优雅的动作,解决很多控制问题,但目前还处在探索阶段。仿真很重要,工具各有特点,目前比较流行有Gazebo、Webots、Vrep、Matlab等,MIT开源的仿真软件也不错。轨迹优化和控制是对期望的控制量进行计算,或者说是在各种约束条件下进行择优,最后到下层控制。这是一个非线性控制问题。各路神仙各显神通,MPC、QP、ZMP等,数值分析方法和最优化控制理论是必备技能。对于自动化或者双控专业出身的攻城狮来说下层控制能够很快掌握,但对于其他没有学过经典控制理论的小伙伴,PID的精髓还需要好好领悟。

     

    聊聊为什么足式机器人特别是四足机器人会火。机器人一直存在于我们“身边”,只是我们发现没有一种移动机器人可以和人深入互动,在家、办公室等场景自由穿梭,理解我们的意图,帮助我们做点“实事”。当前国内外机构展现的足式机器人能力让大家看到希望,人工智能、自动驾驶、5G技术、嵌入式技术的巨大进展为足式机器人的研发提供了强大的支持。至于运控工程师的职业前景如何?从目前来看,国内机器人开发团队正在高速扩张,包括机械臂、四足机器人、双足机器人等都需要运动控制工程师,个人可以在项目中不断加深对被控对象的了解,形成完整的系统框架,具备独立设计运动控制系统的能力,然后可以扩展到更多的机器人项目中。从事这个行业,有机会,有挑战。

    展开全文
  • 【规划】机器人规划算法总结

    千次阅读 2019-02-10 12:13:46
    转发自知乎 搬砖的旺财 1 自主机器人近距离操作运动规划体系 在研究自主运动规划问题之前,首先...并按照机器人的数量与规模,将自主运动规划分为单个机器人的运动规划与多机器人协同运动规划两类规划体系。 1.1...

    转发自知乎 搬砖的旺财

    1 自主机器人近距离操作运动规划体系

    在研究自主运动规划问题之前,首先需建立相对较为完整的自主运动规划体系,再由该体系作为指导,对自主运动规划的各项具体问题进行深入研究。本节将根据自主机器人的思维方式、运动形式、任务行为等特点,建立与之相适应的自主运动规划体系。并按照机器人的数量与规模,将自主运动规划分为单个机器人的运动规划与多机器人协同运动规划两类规划体系。

    1.1 单个自主机器人的规划体系

    运动规划系统是自主控制系统中主控单元的核心部分,因此有必要先研究自主控制系统和其主控单元的体系结构问题。

    自主控制技术研究至今,先后出现了多种体系结构形式,目前被广泛应用于实践的是分布式体系结构,其各个功能模块作为相对独立的单元参与整个体系。随着人工智能技术的不断发展,基于多Agent的分布式体系结构逐渐成为了主流,各功能模块作为独立的智能体参与整个自主控制过程,该体系结构应用的基本形式如图1所示。一方面,主控单元与测控介入处理、姿态控制系统、轨道控制系统、热控系统、能源系统、数传、有效载荷控制等功能子系统相互独立为智能体,由总线相连;另一方面,主控单元为整个系统提供整体规划,以及协调、管理各子系统Agent的行为。测控介入处理Agent保证地面系统对整个系统任意层面的控制介入能力,可接受上行的使命级任务、具体的飞行规划和底层的控制指令;各子系统Agent存储本分系统的各种知识和控制算法,自主完成主控单元发送的任务规划,并将执行和本身的健康等信息传回主控单元,作为主控单元Agent运行管理和调整计划的依据。

    图1 基于多Agent的分布式自主控制系统体系结构基本形式示意图Überschrift

    主控单元Agent采用主流的分层递阶式结构,这种结构层次鲜明,并且十分利于实现,其基本结构如图2所示。主控单元由任务生成与调度、运动行为规划和控制指令生成三层基本结构组成,由任务生成与调度层获得基本的飞行任务,经过运动行为规划层获得具体的行为规划,再由控制指令生成层得到最终的模块控制指令,发送给其它功能Agent。各功能Agent发送状态信息给主控单元的状态检测系统,状态检测系统将任务执行情况和子系统状态反馈回任务生成与调度层,以便根据具体情况对任务进行规划调整。当遇到突发情况时,还可启用重规划模块,它可根据当时情况迅速做出反应快速生成行为规划,用以指导控制指令生成层得到紧急情况的控制指令。此外,地面控制系统在三个层次上都分别具有介入能力。图2中,点划线内是主控单元全部模块,虚线内为运动规划系统,包括运动行为规划模块和重规划模块,这也是运动规划系统的主要功能。

    图2 主控单元基本结构示意图

    明确了自主控制系统与其主控单元的基本结构,以及运动规划系统在主控单元中的基本功能,便可建立运动规划系统的体系结构。运动规划系统的体系结构如图3所示,该系统由规划器和重规划器两大执行单元组成,分别承担对飞行任务的一般规划和对突发事件紧急处理的运动规划。当然,这两部分也可理解为离线规划与在线规划两种,离线规划一般解决平时按部就班的飞行任务,在线规划一般解决突然下达的飞行任务。除规划器以外,系统还配有知识域模块,用以利用特定语言描述相关知识。知识域包括行为域和模型域两个部分,行为域用来存储服务系统一般的运动行为描述和紧急情况下的一些运动行为方面的处理方法(如急停、转向等),模型域用来存储规划所需模型知识,包括环境模型、组装体模型、组装任务对象模型和任务模型等等。

    图3 运动规划系统体系结构示意图

    1.2 多自主机器人协同规划体系

    多智能体系统的群体体系结构一般分为集中式、分散式两种基本结构,分散式结构又可以进一步分为分层式和分布式结构。集中式结构通常由一个主控单元掌握全部环境和受控机器人信息,运用规划算法对任务进行分解,并分配给各受控机器人,组织它们完成任务。其优点是理论条理清晰,实现较为直观;缺点是容错性、灵活性和对环境的适应性较差,与各受控机器人存在通讯瓶颈问题。相对于集中式结构,分散式结构无法得到全局最优解,但它凭借着可靠性、灵活性和较强的环境适应性越来越受到广泛的青睐。分散式结构中的分布式结构没有主控单元,各智能体地位平等,通过各智能体间的通讯和信息交流达到协商的目的,实现最终的决策,但该结构容易片面强调个体,导致占用资源过多,且难于得到磋商结果。分层式结构介乎于集中式和分布式之间,存在主控单元,但并不是由主控单元掌控一切,各智能体也具备一定的自主性,上下级之间按照一定的规则,通过信息流形成完整的整体,共同完成协同任务。

    多自主机器人系统应采用分层式结构,以保证整个系统既适于统一领导,又满足系统灵活、快速的需求。多自主机器人协同规划体系结构如图4所示,按照分层式结构建立两种工作模式:事先的离线规划由主控单元负责,首先获得协同任务,经过规划器得到具体的行为运动规划,并分发给各分系统执行单元,相关的知识域中主要是用于描述各分系统协商规则的协商域,主控单元从外界获取环境信息,从各分系统获取状态信息;当遇到突发事件或紧急任务变更以及主控单元停止工作时,各分系统采用分布式结构,单独规划各自运动行为,并从各自的知识域中获取协商方式,外界环境信息由主控单元发送和自我感知相结合获得(主控单元停止工作时,仅靠自我感知获取信息),其它机器人信息的传输由机器人间的数据链实现。

    2 路径规划研究

    当给定了某一特定的任务之后,如何规划机器人的运动方式将至关重要。机器人的规划包括两部分内容:基座移动到适合操作的位置和转动手臂关节完成操作。包括三个问题:基座点到点运动规划;关节空间规划;综合规划。

    本章研究几种常用的运动规划算法:图搜索法、RRT算法、人工势场法、BUG算法。并对部分算法的自身缺陷进行了一些改进。

    2.1 图搜索法

    图搜索法依靠已知的环境地图以及地图中的障碍物信息构造从起点到终点的可行路径。主要分成深度优先和广度优先两个方向。深度优先算法优先扩展搜索深度大的节点,可以快速的得到一条可行路径,但是深度优先算法得到的第一条路径往往是较长的路径。广度优先算法优先扩展深度小的节点,呈波状的搜索方式。广度优先算法搜索到的第一条路径就是最短路径。

    2.1.1 可视图法

    可视图法由Lozano-Perez和Wesley于1979年提出,是机器人全局运动规划的经典算法。可视图法中,机器人用点来描述,障碍物用多边形描述。将起始点 S 、目标点 G 和多边形障碍物的各顶点(设 V_o 是所有障碍物的顶点构成的集合)进行组合连接,要求起始点和障碍物各顶点之间、目标点和障碍物各顶点之间以及各障碍物顶点与顶点之间的连线均不能穿越障碍物,即直线是“可视的”。给图中的边赋权值,构造可见图 G\left( V,E \right) 。其中点集 V=V_o\cup \left\{ S,G \right\}E 为所有弧段即可见边的集合。然后釆用某种优化算法搜索从起始点 S 到目标点 G 的最优路径,那么根据累加和比较这些直线的距离就可以获得从起始点到目标点的最短路径。

    图5 可视图

    由此可见,利用可视图法规划避障路径主要在于构建可视图,而构建可视图的关键在于障碍物各顶点之间可见性的判断。判断时主要分为两种情况,同一障碍物各顶点之间可见性的判断以及不同障碍物之间顶点可见性的判断。

    1. 同一障碍物中,相邻顶点可见(通常不考虑凹多边形障碍物中不相邻顶点也有可能可见的情况),不相邻顶点不可见,权值赋为 \infty
    2. 不同障碍物之间顶点可见性的判断则转化为判断顶点连线是否会与其它顶点连线相交的几何问题。如下图虚线所示,V_1V_2 分别是障碍物 O_1O_2 的顶点,但 V_1V_2 连线与障碍物其它顶点连线相交,故 V_1V_2 之间不可见;而实线所示的 V_3V_4 连线不与障碍物其它顶点连线相交,故 V_3V_4 之间可见。
    图6 顶点可见性判断

    可视图法能求得最短路径,但搜索时间长,并且缺乏灵活性,即一旦机器人的起始点和目标点发生改变,就要重新构造可视图,比较麻烦。可视图法适用于多边形障碍物,对于圆形障碍物失效。切线图法和Voronoi图法对可视图法进行了改进。切线图法用障碍物的切线表示弧,因此是从起始点到目标点的最短路径的图,移动机器人必须几乎接近障碍物行走。其缺点是如果控制过程中产生位置误差,机器人碰撞障碍物的可能性会很高。Voronoi图法用尽可能远离障碍物和墙壁的路径表示弧。因此,从起始点到目标点的路径将会增长,但采用这种控制方式时,即使产生位置误差,移动机器人也不会碰到障碍物。

    2.1.2 Dijkstra算法

    Dijkstra算法由荷兰计算机科学家艾兹赫尔·戴克斯特拉(Edsger Wybe Dijkstra)发明,通过计算初始点到自由空间内任何一点的最短距离可以得到全局最优路径。算法从初始点开始计算周围4个或者8个点与初始点的距离,再将新计算距离的点作为计算点计算其周围点与初始点的距离,这样计算像波阵面一样在自由空间内传播,直到到达目标点。这样就可以计算得到机器人的最短路径。

    Dijkstra算法是一种经典的广度优先的状态空间搜索算法,即算法会从初始点开始一层一层地搜索整个自由空间直到到达目标点。这样会大大增加计算时间和数据量。而且搜索得到的大量对于机器人运动是无用的。

    2.1.3 A*算法

    为了解决Dijkstra算法效率低的问题,A*算法作为一种启发式算法被提出。该算法在广度优先的基础上加入了一个估价函数。

    2.2 RRT算法

    快速搜索随机树(RRT)算法是一种增量式采样的搜索方法,该方法在应用中不需要任何参数整定,具备良好的使用性能。它利用增量式方法构建搜索树,以逐渐提高分辨能力,而无须设置任何分辨率参数。在极限情况,该搜索树将稠密的布满整个空间,此时搜索树由很多较短曲线或路经构成,以实现充满整个空间的目的。增量式方法构建的搜索树其导向取决于稠密采样序列,当该序列为随机序列时,该搜索树称为快速搜索随机树(Rapidly Exploring Random Tree,RRT),而不论该序列为随机还是确定性序列,都被称为快速搜索稠密树(Rapidly Exploring Dense Trees,RDTs),这种规划方法可处理微分等多种约束。

    2.2.1 算法步骤

    考虑二维和三维工作空间,环境中包含静态障碍物。初始化快速随机搜索树T,只包括根节点,即初始状态S。在自由空间中随机选取一个状态点 x_{rand} ,遍历当前的快速随机搜索树T,找到T上距离 x_{rand} 最近的节点 x_{near} ,考虑机器人的动力学约束从控制输入集 U 中选择输入 u\in U ,从状态 x_{near} 开始作用,经过一个控制周期 \Delta t 到达新的状态 x_{new} 。满足 x_{new}x_{rand} 的控制输入 u 为最佳控制量。将新状态 x_{new} 添加到快速随机搜索树T中。按照这样得到方法不断产生新状态,直到到达目标状态G。完成搜索树构建后,从目标点开始,逐次找到父节点直到到达初始状态,即搜索树的根节点。

    图7 随机树构建过程

    由于在搜索过程中考虑了机器人的动力学约束,因此生成的路径的可行性很好。但是算法的随机性导致其只具备概率完备性。

    2.2.2 改进算法

    LaValle等人的工作奠定了RRT方法的基础。在采样策略方面,RRTGoalBiaS方法在控制机器人随机运动的同时,以一定概率向最终目标运动;RRTGoalZoom方法分别在整个空间和目标点周围的空间进行采样;RRTCon方法则通过加大随机步长改进规划速度。双向规划思想也被采用,衍生出RRTExtExt,RRTExtCon,RRTConCon等多种算法。

    基本RRT算法收敛到终点位姿的速度可能比较慢。为了提高算法的效率和性能,需不断对该算法进行改进。如为了提高搜索效率采用双向随机搜索树(Bi~RRT),从起始点和目标点并行生成两棵RRT,直至两棵树相遇,算法收敛。由于这个算法相比于原始RRT有更好的收敛性,因此在目前路径规划中是很常见的。NikAMelchior提出的粒子RRT算法,考虑了地形的不确定性,保证了在不确定性环境下搜索树的扩展。Kuffner和Lavane又提出RRT-connectlv,使得节点的扩展效率大大提高。运动规划中,距离的定义非常复杂,Pengcheng研究了在RRT生长过程中距离函数不断学习的算法以降低距离函数对环境的敏感性。考虑到基本RRT规划器得到的路径长度一般是最优路径的1.3~1.5倍,英国的J.desmithl研究了变分法技术使其达到最优。Amna A引入KD树作为二级数据结构加速查找距离从环境中取出的随机点最近的叶节点,降低了搜索成本。该算法在动态障碍物、高维状态空间和存在运动学、动力学等微分约束的环境中的运动规划已经得到广泛的应用。

    关于改进RRT算法详情可参考:

    搬砖的旺财:路径规划——改进RRT算法​zhuanlan.zhihu.com

    2.3 滚动在线RRT算法

    基本RRT算法倾向于遍历整个自由空间直到获得可行路径,这使其不可能用于未知或动态环境中的机器人在线运动规划。利用滚动规划的思想可以将RRT算法进行改进,使其具备在线规划能力。

    2.3.1 滚动规划

    机器人在未知或动态环境中运动时,只能探知其传感器范围内有限区域内的环境信息。机器人利用局部信息进行局部运动规划,并根据一定的评价准则得到局部目标。机器人到达局部目标后再次进行新的局部规划。如此反复进行直到到达全局目标。

    滚动规划算法的基本原理:

    1. 环境信息预测:在滚动的每一步,机器人根据探测到的视野内的信息、或所有已知的环境信息,建立环境模型,包括设置已知区域内的节点类型信息等;
    2. 局部滚动优化:将上述环境信息模型看成一个优化的窗口,在此基础上,根据目标点的位置和特定的优化策略计算出下一步的最优子目标,然后根据子目标和环境信息模型,选择局部规划算法,确定向子目标行进的局部路径,并实施当前策略,即依所规划的局部路径行进若干步,窗口相应向前滚动;
    3. 反馈信息校正:根据局部最优路径,驱动机器人行走一段路径后,机器人会探测到新的未知信息,此时可以根据机器人在行走过程探测到的新信息补充或校正原来的环境模型,用于滚动后下一步的局部规划。

    其中,局部子目标是在滚动窗口中寻找一个全局目标的映射,它必须避开障碍物,且满足某种优化指标。子目标的选择方法反映了全局优化的要求与局部有限信息约束的折衷,是在给定信息环境下企图实现全局优化的自然选择。

    基于滚动窗口的路径规划算法依靠实时探测到的局部环境信息,以滚动方式进行在线规划。在滚动的每一步,根据探测到的局部信息,用启发式方法生成优化子目标,在当前滚动窗口内进行局部路径规划,然后实施当前策略(依局部规划路径移动一步),随滚动窗口推进,不断取得新的环境信息,从而在滚动中实现优化与反馈的结合。由于规划问题压缩到滚动窗口内,与全局规划相比其计算量大大下降。

    基于滚动窗口的路径规划算法的具体步骤如下:

    • 步骤0:对起点、终点、工作环境、机器人的视野半径、步长进行初始化;
    • 步骤1:如果终点到达,规划中止;
    • 步骤2:对当前滚动窗口内的环境信息进行刷新;
    • 步骤3:产生局部子目标;
    • 步骤4:根据子目标及已知环境信息,在当前滚动窗口内规划一条优化的局部可行路径;
    • 步骤5:依规划的局部路径行进一步,步长小于视野半径;
    • 步骤6:返回步骤1。

    2.3.2 滚动在线RRT算法流程

    在一个滚动窗口内,随机树以当前位置为起始点,构建传感器范围内的随机树。构建方法与基本RRT算法一致。为了使全局环境中随机树具有向目标方向生长的趋势,在运动规划时引入启发信息,减少随机树的随机性,提高搜索效率。

    Road\left( x_1,x_2 \right) 代表随机树中两个位姿节点间的路径代价, Dis\left( x_1,x_2 \right) 代表随机树中两个位姿节点间的欧几里德距离。类似于A*算法,本算法为随机树中每个节点定义一个估价函数: f\left( x \right)=g\left( x \right)+h\left( x \right) 。其中 g\left( x \right)=Road\left( x,x_{rand} \right) 是随机节点 x_{rand} 到树中节点 x 所需的路径代价。 h\left( x \right) 为启发估价函数,这里取随机节点 x_{rand} 到目标点 x_{goal} 的距离为估价值, h\left( x \right)=Dis\left( x_{rand},x_{goal} \right) 。因此 f\left( x \right) 表示从节点 x 经随机节点 x_{rand} 到目标节点 x_{goal} 的路径估计值。遍历滚动窗口内随机树T,取估价函数最小值的节点 x_{near} ,有 f\left( x_{near} \right)=min\left( f\left( x \right) \right) 。这使得随机树沿着到目标节点估价值 f\left( x \right) 最小的方向进行扩展。

    由于在随机树生长中引入了导向目标的启发估价因子,叶节点 x_{near} 总是选择离目标最近的节点,这可能会使随机树遇到局部极小值问题。因此随机树生长的新节点 x_{new} 必须要克服这个问题,引导随机树更好的探索未知空间。

    这里利用统计学中回归分析生成新节点,将RRT算法探索未知空间的能力进一步增强以避免因启发估价因子导致的局部极小。其思想是探索以前到过的空间是无用的,而且容易陷入局部极小。引进回归分析(regression analysis)是考察新节点与其他节点之间关系,利用回归函数约束,使得随机树不探索以前到过的空间,因此避免了局部极小。

    新节点生成方法是遍历随机树,如果 x_{new} 与其父节点 x_{near} 的距离小于 x_{new} 与扩展树上其他任意节点的距离,即 \exists \ n\in T|Dis\left( x_{near},x_{new} \right)<Dis\left( n,x_{new} \right) ,则选择该节点为随机树新生节点。下图解释了新节点的判断过程。

    图8 新节点的判断

     

    上图中各个空心点是中间的父节点的可能扩展。椭圆圈起的空心点表示这个新节点不符合回归函数约束,剩下的两个未被圈起的空心节点到其父节点的距离小于该节点到随机树上任意节点的距离,这两个点可以成为随机树的新节点。

    综上,滚动窗口内随机树构建的具体步骤如下:

    1. 对滚动窗口随机树T初始化,T开始只包含初始位置S;
    2. 滚动窗口自由空间中随机选择一个状态 x_{rand}
    3. 根据最短路径思想寻找树T中和 x_{rand} 距离最近的节点 x_{near}
    4. 选择输入 u ,使机器人状态由 x_{near}x_{new}
    5. 确定 x_{new} 是否符合回归分析,不符合则回到第4步;
    6. x_{new} 作为随机树T的一个新节点, u 则被记录在连接节点 x_{near}x_{new} 的边上。

    滚动窗口状态空间进行K次采样后,遍历随机树,根据启发估价思想寻找滚动窗口子目标 x_{sub}x_{sub} 是当前滚动窗口中的子树中估价函数最小的点。确定子目标后,机器人前进到子目标点,进行下一轮的滚动RRT规划。如此反复,直到到达目标点G。

    2.4 人工势场法

    人工势场法是由Khatib提出的一种用于机器人运动规划的虚拟力方法。其基本思想是将目标和障碍物对机器人运动的影响具体化成人造势场。目标处势能低,障碍物处势能高。这种势差产生了目标对机器人的引力和障碍物对机器人的斥力,其合力控制机器人沿势场的负梯度方向向目标点运动。人工势场法计算方便,得到的路径安全平滑,但是复杂的势场环境可能在目标点之外产生局部极小点导致机器人无法到达目标。为了解决人工势场法的局部极小点问题,学者们提出了各种改进方法。主要分成两个方向:一个是构造合适的势函数以减小或避免局部极小点的出现;另一种是在机器人遇到局部极小点后结合其他的方法使机器人离开局部极小点。前者一般需要全局地图信息,并且依赖于障碍物的形状。当环境复杂时难以应用。后者多利用搜索法、多势场法和沿墙行走法等方法使机器人离开局部极小点。搜索法利用最佳优先、模拟退火、随即搜索等策略寻找比局部极小点势场值更低的点使机器人继续移动。由于未知环境中大多缺乏启发信息,搜索方法的效率很低。多势场法构造多个全局极小点相同,而局部极小点不同的势函数,在机器人陷入某个局部极小点时,规划器就切换势函数使机器人离开该点。但是在未知的环境中这样的多个势场很难构造,而且该方法可能导致机器人在回到曾逃离的局部极小点。由于局部极小点是某个或多个障碍物的斥力势场与引力势场共同作用产生,其位置与障碍物距离必然不远,沿墙行走法正是利用这样的远离,使机器人在遇到局部极小点后参照类似BUG算法的环绕行为绕过产生局部极小点的障碍物继续前进。这种方法可靠性高,不依赖环境的先验信息和障碍物形状。

    本节构造人工势场进行机器人平动的在线运动规划,利用一种沿墙行走法对基本的人工势场法进行改进。

    2.4.1 基本人工势场法

    作用在机器人上的假想引力和斥力为势函数的负梯度,因而人工势函数应该具有以下特征:

    1. 非负且连续可微;
    2. 斥力势强度距离障碍物越近其强度越大;
    3. 引力势强度离目标位置越近其强度越小。

    空间中的合势场是引力势场与斥力势场之和: U\left( x \right)=U_{att}\left( x \right)+U_{rep}\left( x \right)

    其中, U_{att}\left( x \right) 是目标产生的引力势场; U_{rep}\left( x \right) 是各个障碍物产生的斥力势场之和,即: U_{rep}\left( x \right)=\sum_{j=1}^{n}{U_{rep,j}\left( x \right)}

    这里构造如下的引力势函数和斥力势函数:

    U_{att}\left( x \right)=\left\{              \begin{array}{lr}              \frac{1}{2}\zeta d^2\left( x,G \right)\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ d\left( x,G \right)\leq d{^*_G}  &  \\              d{^*_G}\zeta d\left( x,G \right)-\frac{1}{2}d{^*_G}\zeta \ \ \ \ \ d\left( x,G \right)> d{^*_G}&                \end{array} \right.

    U_{rep,j}=\left\{              \begin{array}{lr}              \frac{1}{2}\eta_j \left( \frac{1}{d_j\left( x \right)}-\frac{1}{Q{^*_j}} \right)^2\ \ \ d_j\left( x \right)\leq Q{^*_j}  &  \\              0\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ d\left( x,G \right)> Q{^*_j}&                \end{array} \right.

    其中, \zeta 表示引力势的相对影响; \eta_j 表示第 j 个障碍物的斥力势的相对影响, x 表示机器人当前位置, G 表示目标点位置, d\left( x,G \right) 表示机器人距目标的距离, d{^*_G} 的作用是在机器人距离目标较远时,削弱目标引力势的作用, d_j\left( x \right) 表示机器人距离第 j 个障碍物的距离, Q{^*_j} 表示第 j 个障碍物的斥力势作用范围。

    \zeta\eta_j 对势场形状的影响很大,适当的增大 \zeta 能够增强引力势场的作用,有助于减少产生局部极小点的可能,并加快机器人向目标运动。 \eta_j 影响机器人在障碍物附近的运动特性, \eta_j 比较大可以使机器人距离障碍物更远,运动路径更安全; \eta_j 比较小,机器人在避开障碍物时运动比较平滑。

    利用上面势函数的梯度可以计算机器人收到的假想引力和斥力:

    f_{att}=-\nabla U_{att}\left( x \right)=\left\{              \begin{array}{lr}              \zeta \left( G-x \right)\ \ \ \ d\left( x,G \right)\leq d{^*_G}  &  \\              \frac{d{^*_G}\zeta d\left( G-x \right)}{d\left( x,G \right)} \ \ \ \ \ d\left( x,G \right)> d{^*_G}&                \end{array} \right.

    f_{rep,j}=-\nabla U_{rep,j}=\left\{              \begin{array}{lr}              \frac{1}{2}\eta_j \left( \frac{1}{Q{^*_j}}-\frac{1}{d_j\left( x \right)} \right)\frac{1}{d{^2_j}\left( x \right)}\nabla d_j\left( x \right)\ \ \ d_j\left( x \right)\leq Q{^*_j}  &  \\              0\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ d\left( x,G \right)> Q{^*_j}&                \end{array} \right.

    2.4.2 人工势场法算法改进

    当机器人的运行环境中包含形状复杂或者距离很近的障碍物时,可能出现势场局部极小点,导致机器人在该处停止或在其周围振动。如下图所示,当环境中出现“陷阱”形障碍物或者与目标成特定位置关系的障碍物时,可能在人工势场中产生局部极小点(图中L点),当机器人运动到局部极小点附近时,势场的负梯度方向指向L点。机器人将在L点处停止或在其附近振动或作圆周运动。

    图9 人工势场法的局部极小点

    为了使机器人从局部极小点中逃离,在人工势场法的基础上引入应激行为,即增加绕行行为。当机器人遇到局部极小点时,忽略目标引力势的作用,沿着斥力势的等势面方向移动,直到机器人离开局部极小区域。改进的算法流程如下:

    1. 根据传感器信息计算当前位置的引力和斥力;
    2. 判断是否处于绕行行为,若是,执行3;若否,执行4;
    3. 判断是否离开局部极小区域,若是,机器人沿着合力方向运动,结束绕行行为;若否,机器人沿着斥力场等势线运动,继续绕行行为;
    4. 判断是否遇到局部极小点,若是,机器人沿着斥力场等势线运动,开始绕行行为;若否,机器人沿着合力方向运动;
    5. 判断是否到达目标,若是,退出算法;若否,继续1;

    使用下面的判别条件判断机器人是否遇到局部极小点。

    条件1: \left| f_{att}+\sum_{j=1}^{n}{f_{rep,j}} \right|<\varepsilon

    条件2: \left| x-x_A \right|<\alpha s_A

    当条件1或者条件2出现时,就认为机器人遇到了局部极小点。条件1中 \varepsilon 是一个很小的正数,其含义是机器人受到的虚拟合力接近0。这是最直接局部极小点判断方法。条件2中 \alpha 为0,1之间某一正数, x_A 为机器人运动过程中某一状态, s_A 表示机器人从 x_A 到达当前位置 x 的总路程,条件2成立意味着机器人在运动很长路程后,位移很小。用来检测机器人在局部极小点附近发生的振动和圆周运动。

    2.5 BUG算法

    BUG算法是一种完全应激的机器人避障算法。其算法原理类似昆虫爬行的运动决策策略。在未遇到障碍物时,沿直线向目标运动;在遇到障碍物后,沿着障碍物边界绕行,并利用一定的判断准则离开障碍物继续直行。这种应激式的算法计算简便,不需要获知全局地图和障碍物形状,具备完备性。但是其生成的路径平滑性不够好,对机器人的各种微分约束适应性比较差。

    2.5.1 BUG1算法

    该算法的基本思想是在没有障碍物时,沿着直线向目标运动可以得到最短的路线。当传感器检测到障碍物时,机器人绕行障碍物直到能够继续沿直线项目标运动。BUG1算法实现了最基本的向目标直行和绕行障碍物的思想。

    假设机器人能够计算两点之间的距离,并且不考虑机器人的定位误差。初始位置和目标位置分别用 \textrm{q}_\textrm{start}\textrm{q}_\textrm{goal} 表示;机器人在 i 时刻的位置表示为 x_il 表示连接机器人位置 x_i 和目标点的直线。初始时, x_i=\textrm{q}_\textrm{start} 。若没有探测到障碍物,那么机器人就沿着 l 向目标直行,直到到达目标点或者遇到障碍物。当遇到障碍物时,记下当前位置 q_i^H 。然后机器人环绕障碍物直到又一次到达 q_i^H ,找到环绕路线上距离目标最近的点 q_i^L ,并沿着障碍物边界移动到该点。随后,直线 l 更新,机器人继续沿直线向目标运动。如果沿这条直线运动时还会遇到该障碍物,那么机器人不能到达目标点。否则算法不断循环直到机器人到达目标点或者规划器认为机器人无法到达目标点。

    图10 BUG1算法运动规划
    图11 BUG1算法中认为机器人无法到达目标点的情况
    图12 BUG1算法伪代码

    2.5.2 BUG2算法

    BUG2算法也有两种运动:朝向目标的直行和沿边界绕行。与BUG1算法不同的是,BUG2算法中的直线 l 是连接初始点和目标点的直线,在计算过程中保持不变。当机器人在点遇到障碍物时,机器人开始绕行障碍物,如果机器人在绕行过程中在距离目标更近的点再次遇到直线 l ,那么就停止绕行,继续沿着直线 l 向目标直行。如此循环,直到机器人到达目标点 \textrm{q}_\textrm{goal} 。如果机器人在绕行过程中未遇到直线 l 上与目标更近的 q_i^L 点而回到了 q_i^H 点,那么得出结论,机器人不能到达目标。

    图13 BUG2算法运动规划
    图14 BUG2算法中认为机器人无法到达目标点的情况
    图15 BUG2算法伪代码

    BUG1和BUG2算法提供了搜索问题的两种基本方法:比较保守的BUG1算法进行详细的搜索来获得最佳的离开点。这需要机器人环绕整个障碍物的边界。而BUG2算法使用一种投机的方法。机器人不环绕完整的障碍物,而选择第一个可用的点作为离开点。对于一般的环境,BUG2算法的效率更高;而对于复杂形状的障碍物,保守的BUG1算法性能更优。

    2.5.3 TangentBUG算法

    TangentBUG算法是对BUG2算法的提高。它利用机器人上距离传感器的读数对障碍物做出提前规避,可以获得更短更平滑的机器人路径。在一个静态环境中,传感器读数 \rho \left( x,\theta \right) 是机器人位置 x 和传感器扫描角度 \theta 的函数,具体点说, \rho \left( x,\theta \right) 是沿着 x 的射线以角度 \theta 到达最近障碍物的距离,

    \rho\left( x,\theta \right)=\mathop{\textrm{min}}_{\lambda \in \left[ 0,\infty \right]}d\left( x,x+\lambda\left[ \textrm{cos}\theta,\textrm{sin}\theta \right]^{\textrm T} \right)

    其中 x+\lambda\left[ \textrm{cos}\theta,\textrm{sin}\theta \right]^{\textrm T}\in\bigcup_{i}{\cal W}{\cal O}_i

    对于某一个固定的位置 x\rho 被传感器视野内的障碍物分割成多个连续区间。如下图所示。 \rho 出现不连续或者到达传感器最大测量范围的角度就是这些连续区间的端点。TangentBUG算法利用者些区间的端点避开工作空间中的障碍物。

    图16 距离传感器扫描障碍物

    \rho 不连续的情况做出说明(如图17所示):点 O_1O_2O_3O_4O_5O_6O_7O_8 与障碍物的不连续性相关;请注意,这里的射线与障碍物相切。 点 O_4 是不连续的,因为障碍物边界落在传感器的范围之外。 O_1O_2O_3O_4O_5O_6O_7O_8 之间的free space边界上的点集是连续性的间隔(加线部分)。

    图17 不连续的示意图

    与其他的BUG算法一样,TangentBUG算法也有两种行为:直行(motion-to-go)和环绕障碍物(boundary-following)。

    首先机器人沿着直线向目标运动,直到它利用传感器观测到在其运动方向的前方有障碍物。不在机器人前方的障碍物对其向目标运动没有影响。比如下图中的障碍物 {\cal W}{\cal O}_2,障碍物 {\cal W}{\cal O}_2 在传感器视野内,但是不阻碍机器人的运动。机器人在刚刚探测到障碍物时,传感器视野圆与障碍物边界相切。随着机器人继续向前移动,这个切点分裂成两个交点 O_1O_2O_3O_4 ), O_1O_2 之间的障碍物边界区间与机器人运动直线相交。

    图18 机器人向目标运动遇到障碍物

    此时,机器人不能继续向目标运动,而从两个交点中选择一个作为局部目标。为比较两个交点对于机器人向目标运动的优劣性,定义探索距离 d_h。在没有关于障碍物的其他信息时,可以将探索距离 d_h 定义为从 x 经过一个交点到目标点的折线长度,即: d_{hi}=d\left( x,O_i \right)+d\left( O_i,\textrm{q}_\textrm{goal} \right)

    例如图19,机器人“看见”了障碍 {\cal W}{\cal O}_1 ,并选择向 O_2 移动,因为 d_{h2}=d\left( x,O_2 \right)+d\left( O_2,\textrm{q}_\textrm{goal} \right) < d_{h1}=d\left( x,O_1 \right)+d\left( O_1,\textrm{q}_\textrm{goal} \right)

    当机器人位于 x 时,它无法知道 {\cal W}{\cal O}_2 阻挡了从 O_2 到目标 \textrm{q}_\textrm{goal} 的路径。

    在图20中,当机器人位于 x 但目标 \textrm{q}_\textrm{goal} 不同时,它具有足够的传感器信息来得出结论: {\cal W}{\cal O}_2 确实阻挡了从 O_2 到目标 \textrm{q}_\textrm{goal} 的路径,从而朝 O_4 行驶。

    因此,选择向 O_2 行驶刚开始的时候可能使得 d\left( x,O_i \right)+d\left( O_i,\textrm{q}_\textrm{goal} \right) 最小化,而不是向 O_4 行驶,但是planner有效地为 d\left( O_2,\textrm{q}_\textrm{goal} \right) 分配无限大的成本代价,因为它有足够的信息来推断任何通过 O_2 的路径都不是最理想的。

    图19
    图20

    机器人将选择探索距离短的交点作为局部目标,向之运动。随着机器人不断运动,交点不断更新,探索距离也不断减小。如下图所示。当 t=1 时,机器人还没有探测到障碍物,因而它向目标作直线运动;当 t=2 时,机器人开始探测到障碍物,并朝向障碍物探索距离近的一侧运动;当 t=3t=4 时,机器人继续移动,同时更新探测区域,在这个过程中探索距离不断减小。

    图21 机器人运动时不断更新局部目标和探测距离

    在机器人运动过程中,探索距离不再减小时,就停止向目标运动行为,切换到环绕边界行为。此时,机器人找到了探测距离的一个极小值,并可计算已探测的障碍物边界与目标 \textrm{q}_\textrm{goal} 的最近距离 d_{followed}。机器人按照原来的方向环绕障碍物运动,同时机器人更新当前探测的障碍物边界与目标的最近距离 d_{reach}。当发现 d_{reach}<d_{followed} 时,机器人停止障碍物环绕行为,继续向目标运动。

    图22 机器人环绕障碍物运动

    如上图所示,当机器人探索到障碍物上的 M 点后,探索距离就不再减小,即 M 点是机器人探索距离在障碍物边界上的局部极小点。机器人开始沿着障碍物边界进行环绕,图中虚线路径就是机器人环绕障碍物时所走的路径。当机器人探测到与目标距离相比 M 点更近的点时,重新开始接近目标的运动。

    2.6 增量式启发算法

    2.6.1 LPA*算法

    LPA*算法,即Lifelong Planning A*算法,该算法于2001年由Sven Koenig和Maxim Likhachev提出,是一种增量启发式搜索版本的A*算法,这种路径规划算法适用于随着时间改变导致有限栅格地图上的边缘代价c(s1,s2)改变的问题,也就是随着时间改变障碍物增多或减少,网格点发生增删等,在许多场合下比再利用A*重新搜索更高效。

    2.6.2 D* Lite算法

    D* Lite算法是以LPA*为基础,是Maxim Likhachev和Sven Koenig于2002年基于LPA*,结合A*算法思想,提出一种增量启发式算法,适用于在未知环境中的导航以及路径规划,广泛用于目前各种移动机器人和自主车辆载具,例如“机遇号”和“勇气号”火星车测试的原型导航系统。

    本章研究了几种常用的运动规划算法。其中,人工势场法应用灵活,可以在保证安全的情况下获得一条平滑路径,并且对于动态环境可以实现实时运动控制。适合用于长距离机动且障碍物较少的情况。而基于随机采样的搜索树方法可以在复杂约束环境中获得可行解,适合用于机械臂近距离操作。

     

    展开全文
  • 目前,基于机器视觉障碍物检测方法大体上分为三类[1]。第一类方法是从单幅图像中提取已知障碍物[2]。这种方法缺点是需要已知障碍物2D图像模式,或者需要一个学习阶段。第二类方法是利用运动信息提取障碍物,...
  • 通常以两足动物的方式运动的机器称为两足动物,即“两只脚”。 我们BIPED项目具有10个自由度,是一款旨在在平坦表面行走的机器人。 从理论上讲,两足动物是指步行,奔跑,跳跃。 但是由于复杂性,我们只能步行。该...
  • 轮式移动机器人分为差动式机器人和全向移动机器人,全向移动机器人得益于无约束的运动学模型,能够在狭窄且复杂多变的环境中自由运行,比传统的差分轮模型及阿克曼模型消耗更少的能量。为了实现全向移动,一般机器人...
  • 机器人执行器

    2011-11-27 16:05:12
    执行装置就是按照电信号指令,将来自电、液压和气压等各种能源能量转换成旋转运动、直线运动方式的机械能装置。按利用能源来分类,主要可分为电动执行装置、液压执行装置和气动执行
  • 当前机器人装配操作比较成熟的是在结构化环境下,针对特定的任务,采用人工示教的方式使机器人进行重复性的运动。这种应用方式极大地减轻了工人的劳动量,提升了产品质量及产品效率,其实质等价于高自由度机床。 2....
  • 该存储库包含与机器人手杖开发相关代码,以用作行动不便轻型运动助手。 它分为两个主要部分,Matlab代码和Arduino代码。 Matlab代码文件夹包含在Matlab和Simulink中创建所有模型,以模拟和分析该概念...
  • 硬件框架(概述应用所采用硬件方案框图,并对核心部分做介绍)软件框架说明(介绍应用所采用软件方案框图、流程图等,并加以解说)在写字机器人设计上我将其分为三个部分: 图像处理模块 运动控制模块 G代码生成...
  • --本文为几年前旧文,原来写在网易博客,但是转不过来,故粘贴与此-- 一般来说3层动作控制方法目前来看仅采用动力学的方式是比较困难,...1是建立在对双足机器人运动平衡精确动力学和静力学分析基础上,...
  • 激光SLAM原理

    千次阅读 2019-09-23 15:13:31
    在机器人运动控制系统架构中,可分为最底层、中间通信层和决策层三大层面,最底层包含了机器人本身的电机驱动和控制部分,中间通信层是底层部分和决策层的通信通路,而决策层则是实现机器人的定位建图及导航。...
  • 激光SLAM初识

    2021-01-08 09:42:34
    在机器人运动控制系统架构中,可分为最底层、中间通信层和决策层三大层面,最底层包含了机器人本身的电机驱动和控制部分,中间通信层是底层部分和决策层的通信通路,而决策层则是实现机器人的定位建图及导航。...
  • 连续轨迹控制(CP)

    2020-10-19 12:35:43
    工业机器人的运动控制方式可以分为点到点控制(PTP)与连续轨迹规划控制(CP)1。如下图所示。 PTP控制下,始末速度为0,期间可以有各种的速度规划方式。 CP控制下,中间点的速度不为0,连贯运动,通过速度前瞻的方式...
  • 将传感器分为两类,一类传感器是携带与机器人本体上的,例如机器人的轮式编码器、相机、激光灯等。一类是安装于环境中的,例如导轨、二维码标志等。安装于环境中的传感设备,通常能够直接测量到机器人的位置信息,...
  • 肢体的运动轨迹最好的学习方法还是观察:举起你的手臂,单纯的移动手肘,观察一下它的运动轨迹,然后手肘不动,单纯的移动前臂,看看它的运动范围,现在结合手肘,手臂作任意移动,观测手掌的运动轨迹,然后试试脚的运动轨迹....
  • 激光SLAM Vs 视觉SLAM

    千次阅读 2017-09-01 15:21:33
    SLAM(同步定位与地图构建),是指运动物体根据传感器信息,一边计算自身位置,一边构建环境地图过程,解决机器人等在未知环境下运动定位与地图构建问题。目前,SLAM主要应用于机器人、无人机、无人驾驶、...
  • 解决这些问题的方法非常多,如携带于机器人本体上的传感器,例如机器人的轮式编码器、相机、激光等等,另一类是安装于环境中的,例如导轨、二维码标志等等。 二.相机 在视觉SLAM中主要是用相机去解决定位与建图...
  • 他不断跟踪自我运动,通过对相对于初始状态这些位姿变化进行积分程序,根据位置和方向获得全局位姿。这就是众所周知所谓航迹推算法。里程计估计可用来提供位姿信息,并辅助机器人控制反馈回路。关键...
  • 【2】速度前瞻控制

    千次阅读 2019-05-22 16:55:12
    机器人运动中为保证轨迹移动精度,插补算法要将运动轨迹离散成大量首尾衔接微小线段。 一般,微小线段间速度衔接分为以下几种: 1、微小线段间无衔接,减速到零,下段再重新启动。这种速度衔接方式,加减速就会...
  • 全英文第三版,机器人分为四个主要区域似乎是合理:机械操纵,运动,计算机视觉和人工智能。本书介绍了机械操纵科学与工程。这个机器人学科在几个经典领域有其基础。主要相关领域是力学,控制理论和计算机科学。...
  • 一文读懂磁传感器

    2021-01-19 16:18:25
    而在当今电子时代,磁传感器在电机、电力电子技术、汽车工业、工业自动控制、机器人、办公自动化、家用电器及各种安全系统等方面都有着广泛应用。磁传感器磁传感器是一种把磁场、电流、应力应变、温度、光等外界...

空空如也

空空如也

1 2
收藏数 38
精华内容 15
关键字:

机器人的运动方式分为