一种动态环境下的实时启发式搜索算法

一、动态环境中的一种实时启发式搜索算法（论文文献综述）

顾梦园^[1]（2021）在《动态环境下移动机器人的路径规划与导航》文中研究指明随着科技的快速发展,移动机器人已经在多个领域中得到了广泛的应用,已然是社会发展中必不可少的部分。其中地面轮式移动机器人是最为常见的一种机器人,其自主导航能力是移动机器人可以完成任务的先要条件。因此路径规划是移动机器人领域中一个重要的问题,它是机器人在移动过程中避开障碍物的重要保证。当今移动机器人已逐渐变为运行在充斥着移动障碍的动态环境中,所以对移动障碍物的应对能力已成为现如今路径规划技术中的重要问题,也是难点所在。在路径规划中一个重要问题是如何提升算法的实时性以及对障碍物的反应能力,这反映了机器人是否能及时准确的完成任务。因此本文以两轮差分式移动机器人为研究对象,研究内容包括在已知环境中提高全局路径规划算法的实时性和在具有未知移动障碍物的动态环境中的机器人局部避障算法。具体内容如下:本文首先对两轮差分式移动机器人的运动学原理建立了运动模型,并使用栅格地图进行环境建模,分析了全局路径规划算法和局部路径规划算法的特点及适用条件。其次,介绍了在栅格地图中搜索速度较快的跳点搜索算法,并对其原理进行分析。针对跳点搜索算法在复杂环境中的搜索效率比较低的问题,提出了一种添加方向判别的改进方法。该方法使用跳点搜索确定最优扩展方向,在最优扩展方向上搜索到障碍物时再次迭代搜索跳点。仿真结果表明改进后的跳点搜索算法在该复杂环境中能够大大提升搜索效率。针对动态环境存在全局路径规划算法不能解决的移动障碍物的问题,提出了融合动态窗口的改进速度障碍法,并使用自适应碰撞半径动态调整碰撞锥的大小。本文采用计算快、实时性高的速度障碍法作为移动机器人避障算法。速度障碍法假设障碍物的运动信息已知且不发生改变,但是在现实中由于传感器的噪声等检测误差,实际机器人获得的障碍物信息不可能是一成不变的,因此本文提出了基于自适应膨胀半径的自适应速度障碍法,以保证机器人与障碍物之间留有安全距离。并使用动态窗口法进一步对自适应速度障碍法产生的可行速度空间进行优化。通过MATLAB进行仿真验证,结果表明改进后的速度障碍法能够有效的提高避障成功的概率,且融合动态窗口的速度障碍法可以跟踪全局路径,发挥全局路径规划出的路径的最优性。

王胜^[2]（2021）在《基于ROS平台的移动机器人路径规划研究》文中研究指明随着社会的发展和科学技术的进步,移动机器人逐渐地走入人们的生活,路径规划作为移动机器人的关键技术,得到了广泛的研究和应用。路径规划技术根据对环境信息的掌握程度,可以分为已知整体环境信息条件下的全局路径规划和对环境信息掌握不全或未知条件下的局部路径规划。基于移动机器人环境运行的复杂性,单一的路径规划算法往往不能同时满足路径安全、路径最优、运行稳定等需求。本文旨在构建兼顾此三种因素的混合路径规划方法,以提高移动机器人工作效能。为此,本文在室内环境中分别对全局和局部两种路径规划算法展开研究,先利用A*算法寻找全局环境信息下的全局最优路径,然后使用动态窗口法（DWA）进行局部路径优化,最后将两者有机融合,构建混合路径规划方法。主要研究内容如下:首先面对已知的室内环境使用A*算法进行全局路径规划研究。针对A*算法规划的路径存在折点多、路径不光滑且部分路径紧贴障碍物等问题,在规划过程中构建障碍物风险评估模型,该模型可限制环境地图中可行路径周围障碍物的个数,提高路径的安全性,同时通过剔除路径中多余的节点,构建有效节点序列,对规划路径进行平滑处理,有效减小路径长度。其次使用DWA算法进行局部路径规划。为了改善靠近目标位置时移动机器人行驶不平稳或驶过目标位置的问题,在DWA算法轨迹评估函数中引入轨迹末端与目标位置的距离参数,提高移动机器人接近目标位置过程中的速度控制效果。同时,为了改进传统算法未考虑移动机器人形状的不足,对环境障碍物进行膨胀处理,并采用安全态和紧急态来划分算法的模拟轨迹,提高移动机器人局部规划的安全性能。最后论文将基于改进的A*算法和DWA算法,将两者有机融合,构建混合路径规划方法。先使用A*算法进行全局路径规划,获取路径中的有效节点信息,并将其作为DWA算法的局部目标点进行局部路径规划,实现两者结合的混合路径规划。通过MATLAB平台仿真和基于ROS的Turtlebot3移动机器人平台的室内环境测试实验,对优化的A*算法、DWA算法以及混合路径规划方法进行了对比研究。实验结果表明,与单一的A*算法或DWA算法相比较,本文构建的混合路径规划方法,对移动机器人在实际行驶过程中的路径安全、路径优化等均有较好的提升。

谷月^[3]（2021）在《基于移动机器人的路径搜索算法研究》文中研究表明移动机器人是一个集环境感知、动态决策与规划、行为控制与执行等多功能于一体的自动执行工作机器装置;具有移动性强、可以在复杂环境中工作的特点,被广泛应用于工业、军事、服务行业中,而路径搜索技术是其实现的关键核心技术。路径搜索的最终目的是使机器人能够按照一定的规则,在具有障碍物的复杂环境中,搜索出一条从起点到终点的最优路径。由于当前路径搜索算法存在调试时间长、路径搜索效果差以及动态避障效率低等问题,仅靠全局搜索方法或局部搜索方法不能更好的完成此类搜索任务。因此,对路径搜索技术的研究在实现移动机器人路径搜索方面具有重要的现实意义。本文在对移动机器人路径搜索技术现有算法分析基础上,针对现有算法的不足,提出了基于扩展点的全局路径规划算法和基于动态障碍物的人工势场算法,解决了路径搜索过程中的搜索时间长、路径搜索效果差和动态避障效率低的问题,达到提高路径搜索的效能和动态规划能力的目的。本文取得的成果主要包括以下几个方面:首先,针对全局路径规划过程中路径节点数目较多、规划效果差的问题,提出了基于扩展点的全局路径规划算法。该算法通过为路径节点添加父指针,设计距离评价函数实现路径节点优化。该算法有效减少路径节点数目,提高全局路径规划的效率。其次,针对移动机器人移动过程中出现的动态障碍物问题,提出基于动态障碍物的人工势场算法。该算法利用全局路径规划获得的路径节点列表作为初始数据来确定局部搜索范围组,对人工势场函数进行改进,增设虚目标模块,有效提高移动方向准确率和实时避障的能力。另外针对移动过程中步长不稳定的问题,通过步长控制函数调整移动步长,提高移动的稳定性。在此基础上,利用MATLAB设计仿真平台对上述成果进行仿真测试。仿真结果表明,与现有算法相比,本文提出的算法能够显着提高移动机器人路径搜索任务的正确率和动态规划能力,达到预期目的。

王昭宁^[4]（2020）在《移动网络中面向终端用户的服务生成关键技术研究》文中指出随着科技的进步,无线网络技术和移动互联网产业快速发展,诸如智能手机、平板电脑、移动穿戴等移动智能设备功能在也变得更加强大,基于移动设备的丰富功能服务和移动网络中种类繁多的Web服务,开发人员创造出了大量的移动应用,使得移动技术愈发融入人们的日常生活,同时激发了用户对于移动应用和服务更加个性化和多样化的需求。传统的移动应用由专业的开发人员在编程的环境中进行开发,他们对用户的需求进行调研和分析,并根据需求针对特定的系统平台设计和实现相应的移动应用。这样的开发过程流程复杂周期冗长,不利于移动应用的跨平台适配,难以满足用户个性化的需求。为了解决以上的问题,本论文在面向服务架构的基础上,研究并提出了面向终端用户的服务生成的关键技术,一方面让终端用户利用跨平台图形化的应用开发环境,根据自己的需求基于组件化的应用生成模型独立开发移动应用,同时研究了 QoS感知自动化的服务组合技术,以用户需求为驱动实现在移动网络中自动化地服务供给,并提出了优化算法。论文的主要的工作和贡献包含了以下三个方面:1)面向终端用户的基于组件的跨平台移动应用生成模型研究。针对面向终端用户服务生成中移动应用开发的问题,提出了一个组件化的跨平台移动应用生成模型。在应用生成模型中,定义了一个服务组件模型和组件插件模型,基于事件驱动的组件聚合方法跨平台构建的移动应用。基于应用生成模型实现的EasyApp系统,为终端用户提供了一个图形化开发移动应用的编辑器和一系列可用于应用开发的Web组件库,能够快速构建跨平台的移动应用。最后演示了应用开发过程,对开发环境在终端用户中的可用性进行了评估,相比对比系统,终端用户使用EasyApp的开发应用的时间减少了约18%。2)QoS感知的自动化服务组合研究。针对移动网络中Web服务供给的问题,研究了 QoS感知的自动化服务组合问题并且提出了两方面的优化方案。一方面研究了自动规划技术中的图规划算法和启发式搜索算法,并使用了自动规划模型,将图规划与启发式搜索相结合,提出了 Q-Graphplan算法,求解QoS感知的自动化服务组合问题。用标准测试集对算法性能进行了测试,并同经典的图规划服务组合算法进行了比较分析,实验结果表明Q-Graphplan减少了约77%冗余服务,平均组合时间降低了约24%。另一方面,为了解决服务组合优化问题中需要考虑的大量的QoS属性的问题,提出了一种多QoS优化目标的服务组合的MaSC算法,它借助了一个全新的时态模型,把待解决的服务组合复杂问题分解成为若干个简单的子问题,并且采用了一个多目标的演化过程搜索近似最优的组合服务集合。采用标准测试集对算法性能进行了测试,并同现有的算法进行了比较分析,MaSC算法求得的服务组合解与最优的偏差减少了约28%,而平均组合时间降低了约73%。3)移动动态网络中的实时服务组合研究。针对在动态的移动网络环境中的服务供给问题,重点关注了在移动自组织网络中服务发现与实时组合的问题。移动自组织网络环境具有缺少中心管理节点、服务主机持续移动等特点,于是将移动服务组合问题建模为实时规划问题,并提出RTASC算法动态地构建移动网络中的服务流程并实时执行。RTASC可分为服务发现和服务执行两个步骤,在服务发现阶段,RTASC采用了去中心化的启发式的服务发现机制,在分散的服务主机节点中发现当前可用的移动服务,并根据服务的依赖关系反向构建启发式覆盖网络。在服务执行阶段,RTASC采用了一种带有前向探测的边规划边执行的策略,实时的规划和执行组合服务。在模拟环境下测试了算法性能,并和现有的同类算法进行了比较分析,结果表明RTASC的组合时间降低了约20%,组合失败率降低了约35%。

张艳,张明路,蒋志宏,吕晓玲^[5]（2020）在《动态环境下移动机器人路径规划的研究》文中研究说明移动机器人路径规划是机器人研究中最关键的技术之一,机器人进行最优的路径规划是其中的难点。文章以目前对移动机器人路径规划的研究现状为基础,通过具体分析与研究,将现有成果进行归纳总结、深入探讨;并依据基本原理与应用场景的不同,将算法划分为智能仿生、几何模型搜索、虚拟势场、强化学习4类;通过对每类算法的分析可得出各算法的优缺点以及主要适用场景,并通过多种不同算法相互结合的方式来解决移动机器人路径规划的问题。该文为动态环境下移动机器人路径规划的研究奠定了一定的理论基础。

肖志成^[6]（2020）在《轮式移动机器人系统及避障技术研究》文中研究表明轮式移动机器人核心技术涵盖了控制器设计,传感器及数据融合技术,运动控制,避障路径规划等,受到了国内外研究者的密切关注。因此,本文面向仓储应用,设计并实现了一个轮式AGV系统,并对其避障路径规划进行研究,研究具有实际应用价值。论文面向仓储的应用,明确了轮式AGV主要设计目标,综合各类传感器的优点设计了基于激光雷达和超声波等多传感器的AGV的系统框架和硬件框架,设计了整套AGV的硬件控制器的原理图和PCB,根据其在仓储使用环境下对控制器的稳定性有较高要求,采取层次模块式的设计,对接口、易受干扰的元器件的布局、布线等进行了优化,从而提高了控制器的稳定性。本体的设计与实现为后续研究奠定了基础。研究了多传感器信息融合方法,针对单独使用陀螺仪或加速度计产生较大误差的缺点,使用卡尔曼滤波器有效融合了陀螺仪和加速度计传感器数据,提高了AGV角度估计的准确性。使用滑动滤波算法解决了编码器噪声较大的问题,提高了速度估计的准确性。使用了扩展卡尔曼滤波融合了加速度计、陀螺仪和编码器数据,解决了编码器产生累计误差的问题,提高了估计位姿的准确性。研究了避障路径规划问题,将改进后动态窗口算法并作为AGV的局部避障算法,通过在动态窗口评价函数的速度权重计算中引入轮式移动机器人当前速度和障碍物之间的距离信息,提高了AGV在障碍物间距较小情况下的避障安全性,和障碍物间距较大情况下的避障效率。针对在实际仓储使用中可能突然出现工作人员导致算法来不及规划避障路径导致碰撞事故的问题,提出了将顶层动态窗口算法和底层控制相结合的改进方案,解决了突发状况下的紧急避障问题。针对激光雷达传感器由于安装高度限制所导致的视野盲区,发现不了低矮物体从而导致撞上的情况,提出将超声波传感器和激光传感器相结合的避障方法,通过顶层与底层程序之间协调控制,运用在AGV的局部避障中,提高了AGV系统运行时候的安全性。在实验中构建了实验环境,对自主开发的AGV进行了系列实验测试与分析,包括小障碍物识别实验、紧急避障实验、单障碍物和多障碍物场景等避障实验。结果表明,设计的轮式AGV在动态环境中稳定运行,能够实时进行避障路径规划,并能安全到达目标点,实验也验证了论文提出的基于动态窗口算法的改进局部避障方案的可行性和安全性。

蒋静静^[7]（2020）在《基于深度强化学习的离散型制造企业车间动态调度研究》文中指出为了适应变化万千、竞争激烈的市场环境,制造企业向多类型、小规模的离散制造模式转变,导致车间生产过程变得复杂动态,发生突发事件的概率大大提高。而目前离散型制造企业使用的车间调度系统,同生产实际情况相差甚远,在复杂动态场合很难应用,通常需要人工对调度方案进行适应性调整。但是人工调整的优劣取决于调度员的经验和知识水平,而且往往需要耗费大量的时间和劳动力,调度方案的稳定性及车间生产效率难以保证。所以,迫切需要改善生产车间依赖人工调整的现状。与此同时,智能制造与数字化工厂的发展,使生产车间产生大量数据,为机器学习的应用提供了可能。在这种环境下,使用深度学习、深度强化学习,开发基于这些数据的自学习、自适应车间调度系统,不仅考虑了这些数据的价值,还可以通过数据对实际调度车间的实现动态感知和智能控制,从而指导实际生产过程出现的各种动态问题,实现车间自适应调度,缓解车间对人工调整的依赖。因此,本文针对车间调度系统在实际应用过程中过度依赖人工的特点,通过对车间历史及实时数据的研究和人工调整经验的总结,将深度学习、深度强化学习融入到高级计划与排程技术,训练生产系统的学习能力,提高生产调度的自适应性和实时性,使调度方案能够更好地适应复杂动态的实际生产过程。主要研究工作如下:（1）通过对生产调度隐性扰动场景的研究,总结不同生产场景下人工调整操作及其效果,设计隐性扰动场景下人工调整方式的选择模型。首先,利用遗传算法仿真出理想调度方案与实际调度方案的累计误差时间作为重调度的触发点。其次,记录该时刻遗传仿真出的生产信息作为深度学习的输入,遗传仿真出的最优人工调整方式作为输出。最后通过LSTM网络,学习生产过程中生产信息与人工调整方式的内在联系,实现隐性扰动下的人工调整方式的选择,并通过具体实例验证了算法的可行性。在隐性扰动场景结合深度学习方法,使得调度方案具有高适用性与通用性。（2）通过对车间显性扰动场景的研究,将具有感知能力的深度学习和具有决策能力的强化学习相结合,将深度强化学习的方式应用于复杂动态车间调度。首先,把车间调度问题视为序列决策问题,以实时生产环境信息作为状态空间,以调度规则作为动作空间,使用加工时间与最大完工时间的组合设置奖惩函数。同时,使用一种多智能体DDPG的深度学习方法训练模型,提高算法更新效率,实现根据实时生产环境信息自动匹配较优的实时调度策略。将深度强化学习的方式融入到APS系统中,提供了一种通用性框架。（3）通过车间调度的标准测试数据,对比遗传算法、传统强化学习算法以及单一调度规则,分别在静态和动态场景下验证作业车间深度强化学习算法的实时性和有效性。本文方法在静态环境中与最优解的调度准确率为91.05%,在动态环境下的准确率为81.28%。与单一调度规则对比,本文算法在保证了实时性的基础上,同时提高了求解质量。与启发式搜索算法进行对比,虽然解的质量略有不足,但算法灵敏性、动态性都得以大幅改进。最后,根据本文研究内容,搭建动态车间调度可视化平台,方便操作人员使用。

孙九博^[8]（2020）在《动态环境移动机器人安全高效的路径规划方法研究》文中研究说明随着科学技术的高速发展,自主移动机器人已应用于多个领域,成为社会发展中不可或缺的一部分。路径规划是移动机器人导航中的一个重要问题,不同类型的机器人服务于各行各业,需要适应不同的动态环境,所以在动态环境下实现安全高效的路径规划是研究领域的一个热点问题。本文针对人工势场法进行研究,分析传统算法的弊端,并提出一种改进的人工势场法,提高动态环境中路径规划的安全性和高效性。主要工作包括以下几个方面:1)传统人工势场法的弊端主要包括:①由于机器人的移动步长较大,在存在障碍物的情况下路径容易发生振荡;②目标不可达;③陷入局部最小区域。本文针对人工势场法中经典的局部极小值问题,对其形成原因、检测方案和常见的解决方案进行讨论,并选择其中的临时虚拟目标点方法改进局部极小值问题。但部分经典方案均需要检测机器人是否陷入局部极小值区域,然后引导机器人离开该区域,路径效率较低。本文针对局部极小值问题,使用动态窗口法改进人工势场法。动态窗口法通过速度采样对轨迹进行模拟,然后利用评价函数求解路径最优解。首先对人工势场法求解的轨迹进行模拟,并根据势场法的特性,设置评价标准选取最优路径。在机器人陷入局部极小值区域时,会选取模拟轨迹中的最优路径,使得算法无需检测该区域,可直接躲避。改进后的算法,提高路径效率、减少检测环节和消除路径振荡问题。2)动态环境下,基于动态窗口法改进的人工势场法规划的路径安全性较低,本文提出基于危险指数的人工势场法来提高安全性。通过引入速度势场进一步改进斥力函数,使机器人躲避动态障碍物不仅仅依赖于两者之间的位置关系。本文引入危险指数的思想,利用机器人和动态障碍物之间的关系,进一步改进速度斥力势场,提出一种基于危险指数改进的人工势场法。危险指数中,根据机器人和动态障碍物的速度关系计算相对速度影响系数,选择不同的避障策略,并建立速度斥力势场,提高路径的效率。根据两者的位置关系计算相对距离影响因子,该因子控制速度斥力势场的影响程度,增加路径的安全性。在相同的实验条件下,将ROS（Robot Operating System）中的路径规划算法与本文算法进行仿真实验对比。实验结果表明,基于危险指数改进后,在慢速的动态环境下,可以规划出与ROS效率相当的路径。而在快速的动态环境下,相较于ROS的路径,本文算法不仅保证了路径的安全性,在路径效率方面也有明显的优势。3)本文将基于危险指数改进的人工势场路径规划算法在移动机器人TIAGo上进行实现,融合多种传感器数据获取环境信息,并利用识别算法和滤波算法对数据进行处理,搭建完整的路径规划系统。最后,搭建复杂的室内动态环境,在该环境中进行路径规划实验,证明该系统的可行性、安全性和高效性。

蒋逸飞^[9]（2020）在《动态场景中的移动机器人避障算法研究》文中研究表明移动机器人路径规划是目前机器人领域中的研究热点。移动机器人路径规划指的就是移动机器人以某种性能指标,根据路径规划算法搜索出一条从起始点到终止点的路径,同时在移动的过程中根据避障模块实时的完成障碍躲避和环境监测。本文对传统人工势场法进行分析和讨论,对人工势场法进行改进,并融合RRT*算法与RRT*-Smart算法,提出两种算法:基于人工势场法的RRT*-Smart优化算法、人工势场法与RRT*结合的优化算法,解决局部极小值问题,同时提高路径规划效率。人工势场法建立虚拟的人工势场模型,在引力势场与斥力势场的共同作用下,移动机器人向着人工势场内的低势能点运动。传统人工势场法存在两大问题:目标不可达问题与局部极小值问题。本文针对局部极小值问题引入子目标点,改进人工势场法函数,使移动机器人先向子目标点移动,再向最终目标点移动,逃离局部极小值点。通过研究采样的快速扩展随机树算法（RRT算法）的基本原理和步骤,分析算法的优势和缺陷,接着引入改进算法RRT*算法与RRT*-Smart算法。提出两个融合算法:基于人工势场法的RRT*-Smart优化算法、人工势场法与RRT*结合的优化算法。基于人工势场法的RRT*-Smart优化算法将RRT*-Smart的思想引入了改进人工势场法;人工势场法与RRT*结合的优化算法首先将人工势场法与RRT*算法融合,再用RRT*-Smart的路径优化思维对全路径进行优化,将RRT*算法的简化后的随机采样过程融入到人工势场法中,同时具有人工势场法的高效性与RRT*算法的快速扩散的优点。本文对两种算法在静态环境与动态环境下进行了多次对比试验,实验表明,基于人工势场法的RRT*-Smart优化算法在在解决人工势场法局部极小值的前提下,极大的提高了人工势场法的效率。人工势场法与RRT*结合的优化算法可以在未知的复杂环境中逃离局部极小值,结合了人工势场法与RRT*算法特性并有效改善了相关缺陷,具有良好的适用性。

陈天星^[10]（2020）在《基于记忆优化机制的改进DQN算法研究》文中研究指明科学技术的进步推动着人工智能的快速发展,强化学习作为人工智能重要分支领域的研究越来越被广泛应用,特别是在解决智能移动机器人导航与探索问题方面。移动机器人导航技术是基础也是机器人完成任务规划的重要保障,例如无人驾驶技术,智能无人机,智能空天一体化技术等都离不开导航技术的发展,而路径规划作为移动导航技术的基础备受广大学者的关注。由于智能移动机器人所面临的环境复杂且多变,传统的路径规划方法已不能满足现有的要求,更加智能化的路径规划算法亟待研究,目前将强化学习与移动机器人导航技术相结合是路径规划算法智能化研究的重要方向之一。鉴于此,针对未知环境下的智能移动路径规划问题,本文提出了一种基于强化学习的机器人路径规划算法,该算法在强化学习框架下开展了路径规划的深入研究,通过机器人“试错”的方式智能探索路径,达到了学习与规划同步完成,满足并适用各种复杂的环境。本文研究内容如下:1、改进传统规划算法在未知环境下距离优化问题,本文提出一种基于启发式报酬函数的DQN（Deep Q＿learning Network）算法。该算法在A*最短路径思想基础上,设计一种以距离作为评判标准的启发式报酬函数,通过当前执行动作对环境信息的探索与理解,利用深度神经网络的计算与反馈,帮助机器人能够快速对当前执行的动作以距离最优为目的的动态抉择,提升算法在距离计算方面的学习效率,并获得其最优解。该算法应用Python语言结合Tkinter模块搭建了两种仿真环境进行验证。其结果表明,在环境复杂训练充分的前提下,本算法相比于RRT、DDPG和原始DQN算法优势明显,路径规划距离分别缩短了33.3%、25.9%、31%（传统的A*算法无法完成规划任务）,但在搜索时间方面略显不足。2、为了解决启发式报酬函数的DQN算法时间成本的问题,本文设计了一种基于记忆机制的优化DQN算法。该机制在记忆库的建立与更新两个方面进行了优化:1)在记忆库建立阶段减少相似记忆,增加无关联记忆;2)在记忆库更新方面采用“TD-error”最小原则方法。以此提高了记忆库中动作的最大学习率,避免重复动作的选择与使用,改善了动作学习的时间成本,达到距离最优兼顾减少搜索时间的目的。该算法应用Python语言结合Tkinter模块搭建了两种仿真环境进行验证。其结果表明,引入记忆优化机制经充分训练后,与RRT、DDPG和原始DQN算法在搜索时间方面相比分别缩短了14.3%、9.1%和53.8%,同时Loss函数图也印证了学习效果最佳。综上所述,本文提出的基于强化学习的路径规划改进方法在距离最优兼顾搜索时间方面取得了较好的研究结果,达到了预期效果,对智能移动导航方面具有较强的理论与现实意义。

二、动态环境中的一种实时启发式搜索算法（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、动态环境中的一种实时启发式搜索算法（论文提纲范文）

（1）动态环境下移动机器人的路径规划与导航（论文提纲范文）

致谢

摘要

abstract

第一章绪论

1.1 课题研究背景及意义

1.2 国内外研究现状分析

1.2.1 全局路径规划算法研究现状

1.2.2 局部路径规划算法研究现状

1.3 课题来源和主要工作

第二章路径规划方法理论基础

2.1 轮式机器人运动模型

2.2 环境建模

2.2.1 拓扑地图法

2.2.2 可视图法

2.2.3 自由空间法

2.2.4 栅格地图法

2.3 基于图的全局路径搜索

2.3.1 深度优先搜索

2.3.2 广度优先搜索

2.3.3 DIJKSTRA算法

2.3.4 A*算法

2.4 局部路径规划算法

2.4.1 人工势场法

2.4.2 动态窗口法

2.5 本章小结

第三章基于栅格地图的改进JPS路径规划算法

3.1 JPS算法

3.1.1 JPS算法介绍

3.1.2 JPS算法原理

3.2 JPS算法的改进

3.3 仿真实验与分析

3.4 本章小结

第四章融合动态窗口的改进速度障碍法

4.1 速度障碍法

4.1.1 速度障碍法的介绍

4.1.2 速度障碍法的原理

4.1.3 速度障碍法的参数计算

4.2 速度障碍法的改进

4.2.1 速度障碍法的缺点

4.2.2 自适应速度障碍法

4.3 与动态窗口法的融合

4.4 仿真实验与分析

4.4.1 自适应速度障碍法

4.4.2 融合动态窗口的自适应速度障碍法

4.5 本章小结

第五章总结与展望

5.1 论文工作总结

5.2 下一步工作计划

参考文献

攻读硕士学位期间的学术活动及成果情况

（2）基于ROS平台的移动机器人路径规划研究（论文提纲范文）

摘要

abstract

第1章绪论

1.1 研究背景与研究意义

1.2 移动机器人研究现状

1.3 移动机器人的关键技术

1.4 论文研究内容及章节安排

第2章移动机器人路径规划技术

2.1 路径规划的概念

2.2 环境地图的构建

2.3 移动机器人路径规划方法

2.4 本章小结

第3章基于栅格地图A*算法的全局路径规划

3.1 栅格地图构建

3.1.1 障碍物处理

3.1.2 栅格标识方法

3.2 A*算法的基本原理

3.3 改进的A*算法

3.3.1 引入节点周围障碍物信息

3.3.2 仿真实验与结果分析

3.3.3 路径平直光滑处理

3.3.4 路径平直光滑仿真分析

3.4 本章小结

第4章基于动态窗口法的局部路径规划

4.1 动态窗口法的基本原理

4.1.1 运动学模型

4.1.2 速度空间

4.1.3 评估函数

4.1.4 DWA算法的实现

4.2 改进的DWA算法

4.2.1 改进评估函数

4.2.2 路径安全性处理

4.3 仿真实验与结果分析

4.4 本章小结

第5章基于ROS移动机器人的混合路径规划

5.1 ROS系统简介

5.1.1 ROS系统架构

5.1.2 ROS文件系统层级

5.1.3 ROS计算图层级

5.1.4 ROS开源社区层级

5.2 实验平台的简介

5.3 混合路径规划方法的仿真和分析

5.3.1 混合路径规划流程

5.3.2 仿真实验与分析

5.4 混合路径规划实验

5.4.1 Gazebo环境实验

5.4.2 真实环境实验

5.5 本章小结

第6章总结与展望

6.1 总结

6.2 展望

参考文献

致谢

（3）基于移动机器人的路径搜索算法研究（论文提纲范文）

摘要

abstract

第1章绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 全局路径规划

1.2.2 动态路径搜索

1.3 研究目标和内容

1.4 本文组织结构

第2章路径搜索相关技术研究与分析

2.1 路径搜索技术基本理论

2.2 路径搜索任务的协同性

2.3 路径搜索系统的基本架构

2.4 路径搜索系统的控制结构

2.4.1 服务型控制结构

2.4.2 工业型控制结构

2.4.3 传统型控制结构

2.4.4 人工智能型控制结构

2.5 本章小结

第3章全局路径规划算法的研究

3.1 常见全局路径规划算法

3.1.1 现有算法基本原理

3.1.2 算法分析

3.2 路径搜索环境模型

3.3 基于扩展点的全局路径规划算法(GPP-EP)的提出

3.3.1 路径节点的规划

3.3.2 路径节点的优化

3.3.3 逆向提取全局路径

3.3.4 GPP-EP算法的基本步骤

3.4 本章小结

第4章动态路径搜索算法的研究

4.1 常见动态搜索算法

4.1.1 现有算法基本原理

4.1.2 算法分析

4.2 人工势场模型

4.3 基于动态障碍物的人工势场算法(APF-DO)的提出

4.3.1 人工势场函数设计

4.3.2 增设虚目标模块

4.3.3 移动步长控制

4.3.4 APF-DO算法的步骤

4.4 本章小结

第5章系统仿真与测试

5.1 仿真系统的搭建

5.1.1 路径搜索系统的控制结构

5.1.2 仿真实验平台的搭建

5.2 建模仿真与分析

5.2.1 全局路径规划

5.2.2 动态路径搜索

5.3 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

（4）移动网络中面向终端用户的服务生成关键技术研究（论文提纲范文）

摘要

ABSTRACT

主要缩略语及中英文对照

第一章绪论

1.1 研究背景及意义

1.1.1 Web组件与跨平台移动应用开发

1.1.2 Web服务与面向服务的计算

1.1.3 移动动态网络中的服务组合

1.2 研究内容与主要贡献

1.3 本文的组织结构

第二章相关研究综述

2.1 整体研究规划

2.2 面向终端用户的移动应用开发技术介绍

2.2.1 编程式开发环境

2.2.2 图形化开发环境

2.2.3 跨平台技术介绍

2.2.4 Web组件技术介绍

2.3 QoS感知的自动化服务组合技术

2.3.1 Web服务技术

2.3.2 静态的服务组合技术

2.3.3 自动化的服务组合技术

2.4 移动动态网络中的服务组合技术

2.4.1 开放式服务发现技术

2.4.2 分布式服务组合技术

2.4.3 实时启发搜索技术

2.4.4 本章小结

第三章面向终端用户基于组件的跨平台移动应用生成模型研究

3.1 引言

3.2 研究动机及问题分析

3.3 跨平台移动应用组件化生成模型

3.3.1 服务组件模型

3.3.2 跨平台移动应用模型

3.4 系统架构

3.5 系统演示和评估

3.5.1 系统实现

3.5.2 示例应用开发

3.5.3 可用性评估

3.6 结论与展望

第四章基于扩展图规划的QoS感知的自动化服务组合方法研究

4.1 引言

4.2 研究动机及问题分析

4.3 服务组合相关概念定义

4.3.1 服务模型

4.3.2 QoS模型

4.3.3 问题定义与映射

4.4 Q-Graphplan

4.4.1 构建扩展的规划图

4.4.2 提取启发信息

4.4.3 转换图

4.4.4 反向A~*搜索

4.5 实验结果与分析

4.5.1 实验环境与数据集

4.5.2 实验结果与分析

4.6 结论与展望

第五章基于时态模型和多目标优化的QoS感知自动化服务组合方法研究

5.1 引言

5.2 研究动机及问题分析

5.3 问题定义与概念描述

5.3.1 问题定义

5.3.2 Pareto集合概念

5.4 时间线模型概念

5.4.1 时态子目标

5.4.2 服务执行时间线

5.5 多目标优化的QoS感知自动化服务组合方法

5.5.1 流程概述

5.5.2 初始化过程

5.5.3 演化过程

5.6 实验测试与结果分析

5.6.1 实验数据集

5.6.2 实验环境与参数配置

5.6.3 实验结果分析

5.6.4 复杂度分析

5.7 结论和展望

第六章移动动态网络中实时自动化服务组合方法研究

6.1 引言

6.2 研究动机及问题分析

6.3 实时服务组合基本概念

6.3.1 服务模型

6.3.2 实时约束

6.3.3 问题定义

6.4 基于前向探测的实时自动化服务组合方法

6.4.1 流程概述

6.4.2 启发式服务发现方法

6.4.3 基于前向探测的实时组合

6.5 实验测试与结果分析

6.5.1 实验环境与参数配置

6.5.2 实验结果与分析

6.6 结论与展望

第七章总结与展望

7.1 工作总结

7.2 未来展望

参考文献

致谢

攻读学位期间取得的研究成果

（5）动态环境下移动机器人路径规划的研究（论文提纲范文）

0 引言

1 智能仿生算法

1.1 PSO算法

1.2 BFA算法

1.3 人工免疫法

1.4 模糊神经网络

1.5 蚁群算法

1.6 遗传算法

2 基于几何模型的路径规划

2.1 RRT算法

2.2 改进的A*算法

2.3 格栅法

3 基于虚拟势场的算法

4 强化学习

5 结论

（6）轮式移动机器人系统及避障技术研究（论文提纲范文）

摘要

abstract

第1章绪论

1.1 研究背景及选题意义

1.1.1 研究背景

1.1.2 选题意义

1.2 国内外研究现状

1.2.1 轮式移动机器人技术

1.2.2 轮式移动机器人的避障技术

1.3 研究内容及组织结构

1.3.1 论文主要研究内容

1.3.2 论文组织结构

第2章面向仓储运输的AGV系统本体设计与实现

2.1 轮式移动机器人的设计

2.1.1 轮式移动机器人的系统结构设计

2.1.2 AGV的硬件结构设计

2.1.3 AGV的软件及开发环境

2.1.4 AGV的机械结构设计

2.2 轮式移动机器人的控制器设计

2.2.1 AGV控制器原理图设计

2.2.2 AGV的控制器PCB设计

2.3 轮式移动机器人的关键技术

2.3.1 轮式移动机器人的顶层操作系统

2.3.2 轮式移动机器人的运动建模

2.3.3 轮式移动机器人的环境建模

2.4 本章小结

第3章基于多传感器信息融合改进AGV的姿态估计

3.1 常用传感器在AGV中位姿估计出现的问题分析

3.1.1 陀螺仪和加速度计使用中存在的问题

3.1.2 光电编码器在使用中存在的问题

3.2 多传感器信息融合技术

3.2.1 多传感器融合技术

3.2.2 卡尔曼滤波器

3.3 基于卡尔曼滤波器改进AGV的姿态估计

3.3.1 改进AGV姿态估计的整体方案

3.3.2 改进AGV估计角度的对比实验

3.3.3 改进AGV的估计位姿的对比实验

3.4 本章小结

第4章基于改进动态窗口算法的AGV避障算法

4.1 避障算法研究

4.1.1 避障算法的分类

4.1.2 常用全局避障算法

4.1.3 常用局部避障算法

4.2 自适应动态窗口改进算法

4.2.1 动态窗口算法的具体过程

4.2.2 改进速度权重动态调整

4.2.3 改进后算法流程

4.2.4 改进前后对比实验分析

4.3 基于动态窗口的改进避障策略

4.3.1 实际工程中遇到的问题

4.3.2 改进的局部避障策略

4.3.3 改进后的整体避障方案

4.3.4 改进前后对比实验分析

4.4 本章小结

第5章 AGV系统的避障实验及分析

5.1 实验环境搭建

5.2 单动态障碍物避障实验

5.3 多动态障碍物避障实验

5.4 实验结果及分析

5.5 本章小结

第6章总结和展望

6.1 主要工作与创新点

6.2 后续研究工作

参考文献

致谢

攻读硕士学位期间从事的科研工作及取得的成果

（7）基于深度强化学习的离散型制造企业车间动态调度研究（论文提纲范文）

摘要

英文摘要

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 实际生产车间调度流程[9]

1.2.2 动态车间调度策略的研究现状

1.2.3 动态车间调度优化算法的研究现状

1.2.4 强化学习在动态车间调度问题的研究现状

1.2.5 国内外现状研究总结

1.3 论文研究内容及组织结构

1.3.1 论文的研究内容

1.3.2 论文的组织结构

1.4 本章小结

2 深度强化学习理论及其在人工调整中的应用方案

2.1 引言

2.2 强化学习概述[63]

2.2.1 智能体的概念

2.2.2 强化学习基本概念

2.2.3 马尔可夫决策过程

2.2.4 Q-learning

2.3 深度强化学习概述[66]

2.3.1 Deep Q-network算法

2.3.2 DPG算法

2.3.3 Actor-Citic算法

2.3.4 DDPG算法

2.4 车间调度人工调整及其模拟策略

2.4.1 人工调整分类及调整策略

2.4.2 基于深度学习、深度强化学习的人工调整问题研究路线

2.5 本章小结

3 基于深度学习的隐性扰动下人工调整策略模拟

3.1 引言

3.2 隐性扰动下人工调整数据样本生成

3.2.1 调整时刻点确定

3.2.2 深度网络的输入

3.2.3 深度网络的输出标签

3.2.4 遗传算法仿真产生样本数据

3.3 基于深度学习的人工调整方式选择实现

3.3.1 数据预处理

3.3.2 深度强化学习网络实现

3.4 本章小结

4 深度强化学习在动态车间调度问题上的应用

4.1 引言

4.2 车间调度问题描述

4.2.1 符号说明

4.2.2 假设条件

4.2.3 目标函数

4.3 车间调度问题的转化

4.3.1 状态空间

4.3.2 动作空间

4.3.3 奖惩函数

4.3.4 环境搭建

4.4 深度强化学习算法

4.4.1 动作探索策略

4.4.2 激活函数的选择

4.4.3 DDPG算法

4.5 实例验证

4.6 本章小结

5 实例分析及可视化平台搭建

5.1 引言

5.2 环境模型配置

5.2.1 开发环境

5.2.2 测试环境

5.3 静态环境

5.4 动态环境

5.5 大规模算例

5.6 系统界面搭建

5.7 本章小结

6 总结与展望

6.1 总结

6.2 展望

致谢

参考文献

（8）动态环境移动机器人安全高效的路径规划方法研究（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 课题研究背景与意义

1.2 路径规划国内外研究现状

1.2.1 静态环境下路径规划算法

1.2.2 动态环境下路径规划算法

1.3 论文主要研究内容

第2章传统的人工势场法在静态环境的路径规划

2.1 传统人工势场法

2.1.1 引力势场

2.1.2 斥力势场

2.1.3 合力势场

2.2 传统APF算法在静态环境下路径规划仿真实验

2.2.1 仿真实验平台

2.2.2 静态环境下路径规划仿真实验

2.2.3 传统APF算法问题分析

2.3 局部极小值问题的经典解决方案

2.3.1 局部极小值区域检测

2.3.2 局部极小值问题的解决方案

2.3.3 临时虚拟目标点仿真实验

2.4 本章小结

第3章动态人工势场法的设计与实验

3.1 动态窗口法

3.1.1 运动学模型分析

3.1.2 速度空间搜索与轨迹评价函数

3.2 动态人工势场法

3.2.1 双轮差速运动模型分析

3.2.2 改进的斥力势场函数

3.2.3 动态人工势场法

3.2.4 DAPF算法在静态环境下路径规划仿真实验

3.3 动态障碍运动模型与避障实验

3.3.1 动态障碍物运动模型

3.3.2 DAPF算法在动态环境下路径规划仿真实验

3.4 本章小结

第4章基于危险指数的动态人工势场法的设计与实验

4.1 基于速度势场改进的人工势场法

4.1.1 速度斥力势场

4.1.2 VDAPF算法在动态环境下路径规划的仿真实验

4.2 基于危险指数的动态人工势场法

4.2.1 危险指数

4.2.2 基于危险指数的动态人工势场法

4.2.3 DIAPF算法在动态环境下路径规划的仿真实验

4.3 DIAPF算法和A~*+DWA在复合环境下路径规划的仿真实验对比

4.3.1 ROS的路径规划算法

4.3.2 A~*+DWA在复合环境下路径规划的仿真实验

4.3.3 DIAPF算法在复合环境下路径规划的仿真实验与对比

4.4 本章小结

第5章基于DIAPF的室内机器人路径规划系统

5.1 系统软硬件平台

5.1.1 系统硬件平台

5.1.2 系统软件平台

5.2 障碍物状态估计

5.2.1 激光雷达数据处理

5.2.2 动态障碍物检测及状态估计

5.2.3 传感器与机器人的坐标系变换

5.3 路径规划系统在仿真环境中实现

5.3.1 在静态环境下系统实现

5.3.2 在复合环境下系统实现

5.4 本章小结

第6章结论与展望

6.1 本文主要研究成果

6.2 展望

参考文献

致谢

攻读学位期间发表的学术论文目录

硕士期间参加的科研工作

学位论文评阅及答辩情况表

（9）动态场景中的移动机器人避障算法研究（论文提纲范文）

摘要

abstract

第1章绪论

1.1 研究背景及意义

1.2 研究现状

1.2.1 启发式搜索算法

1.2.1.1 蚁群算法

1.2.1.2 遗传算法

1.2.1.3 模拟退火算法

1.2.2 可视图法

1.2.3 人工势场法

1.2.4 RRT算法

1.3 本文主要研究内容及组织结构

第2章人工势场法算法分析

2.1 引言

2.2 人工势场法基本原理

2.2.1 引力势场

2.2.2 斥力势场

2.2.3 合成势场

2.3 仿真实验

第3章改进人工势场法

3.1 传统势场法缺陷分析

3.2 目标不可达问题

3.3 局部极小值问题

3.3.1 子目标点的设置

3.3.2 改进势场函数

3.4 仿真实验

3.5 本章小结

第4章 RRT算法及其改进算法

4.1 RRT算法

4.1.1 RRT算法简介

4.1.2 RRT算法原理

4.2 RRT*算法

4.3 RRT*-Smart算法

第5章人工势场法与RRT算法融合策略

5.1 算法融合策略

5.1.1 基于人工势场法的RRT*-Smart优化算法

5.1.2 人工势场法与RRT*结合的优化算法

5.2 动态环境下算法改进

5.2.1 动态环境下的算法概述

5.2.2 算法改进策略

5.3 动态环境仿真实验

5.3.1 动态环境下基于人工势场法的RRT*-Smart优化算法

5.3.2 动态环境下人工势场法与RRT*结合的优化算法

5.4 本章总结

第6章结语

致谢

参考文献

攻读学位期间的研究成果

（10）基于记忆优化机制的改进DQN算法研究（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 论文研究背景及意义

1.2 国内外研究现状

1.2.1 传统路径规划方法研究现状

1.2.2 强化学习方法研究现状

1.2.3 强化学习在路径规划方面的研究现状

1.3 论文章节安排

第2章相关理论技术基础

2.1 强化学习理论基础

2.1.1 马尔科夫决策过程

2.1.2 基于模型的强化学习

2.1.3 基于采样统计的强化学习方法

2.2 Q_learning算法

2.2.1 Q_learning算法原理

2.2.2 算法收敛性分析

2.3 基于深度神经网络的Q_learning算法

2.3.1 深度神经网络DNN算法

2.3.2 神经网络拟合Q值表

2.3.3 双网络结构设计

2.4 本章小结

第3章基于启发式报酬函数的DQN算法

3.1 启发式搜索算法

3.2 启发式报酬函数设计

3.2.1 启发式报酬函数原理

3.2.2 算法整体设计

3.3 实验及结果分析

3.4 本章小结

第4章基于记忆优化机制的DQN算法

4.1 样本预处理方法

4.2 记忆优化机制设计

4.2.1 记忆优化机制原理

4.2.2 相似记忆

4.2.3 记忆更新原则

4.2.4 算法设计

4.3 实验验证分析

4.4 本章小结

第5章总结与展望

5.1 论文工作总结

5.2 研究展望

参考文献

致谢

攻读学位期间发表的学术论文目录

四、动态环境中的一种实时启发式搜索算法（论文参考文献）

[1]动态环境下移动机器人的路径规划与导航[D]. 顾梦园. 合肥工业大学, 2021(02)
[2]基于ROS平台的移动机器人路径规划研究[D]. 王胜. 湖北大学, 2021(01)
[3]基于移动机器人的路径搜索算法研究[D]. 谷月. 沈阳理工大学, 2021(01)
[4]移动网络中面向终端用户的服务生成关键技术研究[D]. 王昭宁. 北京邮电大学, 2020(02)
[5]动态环境下移动机器人路径规划的研究[J]. 张艳,张明路,蒋志宏,吕晓玲. 合肥工业大学学报(自然科学版), 2020(10)
[6]轮式移动机器人系统及避障技术研究[D]. 肖志成. 重庆邮电大学, 2020(02)
[7]基于深度强化学习的离散型制造企业车间动态调度研究[D]. 蒋静静. 西安理工大学, 2020(01)
[8]动态环境移动机器人安全高效的路径规划方法研究[D]. 孙九博. 山东大学, 2020(02)
[9]动态场景中的移动机器人避障算法研究[D]. 蒋逸飞. 南昌大学, 2020(01)
[10]基于记忆优化机制的改进DQN算法研究[D]. 陈天星. 河南大学, 2020(02)

标签：机器人论文; 路径规划论文; 启发式搜索论文; 移动机器人论文; 系统仿真论文;

一种动态环境下的实时启发式搜索算法

一、动态环境中的一种实时启发式搜索算法（论文文献综述）

二、动态环境中的一种实时启发式搜索算法（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、动态环境中的一种实时启发式搜索算法（论文提纲范文）

（1）动态环境下移动机器人的路径规划与导航（论文提纲范文）

（2）基于ROS平台的移动机器人路径规划研究（论文提纲范文）

（3）基于移动机器人的路径搜索算法研究（论文提纲范文）

（4）移动网络中面向终端用户的服务生成关键技术研究（论文提纲范文）

（5）动态环境下移动机器人路径规划的研究（论文提纲范文）

（6）轮式移动机器人系统及避障技术研究（论文提纲范文）

（7）基于深度强化学习的离散型制造企业车间动态调度研究（论文提纲范文）

（8）动态环境移动机器人安全高效的路径规划方法研究（论文提纲范文）

（9）动态场景中的移动机器人避障算法研究（论文提纲范文）

（10）基于记忆优化机制的改进DQN算法研究（论文提纲范文）

四、动态环境中的一种实时启发式搜索算法（论文参考文献）

猜你喜欢