报告时间:2024年11月27日 19:00-20:00
报告方式:腾讯会议 176951004
报告题目:复杂约束下多智能体协同决策:基于一致性惩罚的分布式算法
主讲嘉宾:梁舒
主办单位:研究生院
协办单位:系统科学与统计学院
内容简介:
多智能体系统在集群自主协同、博弈对抗、工业制造等科学与工程领域得到广泛关注。受局部信息、邻居交互等因素限制,多智能体协同任务往往要实现关键变量的一致性。本报告围绕多智能体决策层面带复杂约束的优化与博弈问题,介绍近年来课题组在求解这些问题所发展的一系列基于一致性惩罚的分布式算法。主要分为以下四方面内容。
针对带有相同局部约束的最优一致性优化问题,我们提出了一个指数收敛的分布式算法。集合约束通常导致分布式算法中的非线性,并导致推导出指数收敛率方面的困难。我们通过精确惩罚方法消除了一致性约束,然后借助微分包含和差分投影算子提出了一种分布式投影次梯度算法。我们通过非光滑方法证明了该算法的收敛性,并在一些前提条件下给出了次线性和指数收敛速度。
针对带有互异局部约束的最优一致性优化问题,通过采用精确惩罚来消除所有这些约束,从而可以通过次梯度下降微分包含直接求解。当成本函数是凸函数时,该算法实现了O(1/t)的收敛速度。此外,当成本函数是强凸函数时,算法具有指数收敛速度。与原始-对偶方法相比,我们的方法不需要对偶变量来处理约束,从而节省了计算和通信资源。此外,当局部约束不同时,该方法克服了现有基于精确惩罚的指数收敛分布式算法中出现的发散问题。
针对带有耦合约束的分布式优化问题,提出了一个包含局部乘子和非光滑惩罚函数的修改拉格朗日函数。然后,我们通过基于投影原始-对偶次梯度动力学的分布式连续时间算法来构建。基于非光滑分析和李雅普诺夫函数,得到非光滑算法解的存在性和收敛性。
针对带有耦合约束的广义纳什均衡博弈问题,考虑设计分布式算法。通过采用局部拉格朗日函数消除了耦合约束,并构造精确惩罚项实现了乘子的最优一致性,得到一组没有任何耦合约束和一致性约束的均衡条件。而且,这些条件仅基于策略和乘子变量,无需辅助变量。在此基础上,提出了一种分布式降阶动力学用来更新策略和乘子变量,且具有收敛性保证。与许多分布式算法相比,所提出的算法不包含辅助变量,因此可以节省计算量和通信量。
最后,报告也对后续开展复杂多智能体决策控制一体化相关进行简要展望。
专家简介:
梁舒,同济大学特聘研究员、博士生导师,主要从事多智能体系统分布式优化、博弈论等相关领域的研究。主持国家自然科学基金面上项目1项、青年基金1项;参与在研课题,包括国家重点研发计划(子课题负责人)、上海市人工智能重大专项等。为中国自动化学会无人系统自主运行专委会委员。担任中国人工智能学会会刊《智能系统学报》青年编委。在耦合约束优化、分布式非光滑凸优化、分布式均衡计算等方面取得了一系列先进成果,发表论文70余篇,被引2000余次,其中以第一作者或通讯发表期刊论文30余篇,包括控制领域顶刊IEEE Trans. on Automatic Control和Automatica论文11篇。