探索基于学习与反馈的智能系统理论——郭雷院士在第10届ICIAM世界大会作邀请报告

发布时间:2023-08-26  |  来源:系统控制重点实验室

 

第10届国际工业与应用数学大会(ICIAM 2023)于 2023年8月20日-25日在日本东京举行。国际工业与应用数学大会(ICIAM)是国际工业与应用数学领域水平最高、规模最大、影响最广的学术盛会,每四年召开一次。本届大会盛况空前, 参会注册代表达5500余人。本届大会共有27位著名应用数学家作邀请报告(Invited Lecture),这些学者是由大会专门成立的遴选委员会通过投票选举产生的, 被邀请者都是学界公认的领头科学家。系统控制重点实验室的郭雷院士是本届大会中仅有的两位作邀请报告的华人学者之一。

 

8月25日上午,郭雷院士作了题为“Learning and Feedback in the Control of Uncertain Dynamical Systems”的邀请报告,分享了与合作者在不确定性动态系统控制研究领域的重要发现和研究进展。在报告中,郭雷院士指出,学习与反馈是应对动态系统中不确定性的一对互补机制,也是智能系统中的两个关键机制。学习在智能系统设计与运行中具有基础性作用,而反馈可以使得系统自身在复杂开放环境中有效应对各种不确定性的影响。

 

报告主要包含三部分内容。首先,郭雷院士介绍了一个将学习与反馈机制相结合的典型案例——著名的自校正调节器(STR)。STR是通过将递推最小二乘估计器与最小(跟踪)方差控制器进行在线耦合,并实时应用于同一个反馈回路中得到的。由于相应的闭环控制系统的性质由复杂的非线性非平稳随机动力学方程组所决定,如何从数学上严格建立这类最基本的“认知-决策”型自适应智能系统的理论基础, 曾是控制理论领域长期悬而未决的著名难题,得到国内外同行的极大关注和广泛研究。郭雷院士介绍了在自校正调节器研究上取得突破的关键思想,以及关于自适应闭环智能系统全局稳定性与收敛性的具体理论结果。

 

随后,郭雷院士介绍在工业控制系统中广泛应用的核心算法——著名PID(比例-积分-微分)反馈控制器得到成功应用背后的基本原理和理论基础。针对一类基本的二阶非线性不确定性动态系统,他与合作者证明了PID反馈控制器具有“大范围双边鲁棒性”,并发现PID控制器结构中实际上隐含一个在线学习机制,这从基本原理上对PID反馈控制为何在应用中如此成功给出了理论解释。他还在报告中展示了关于PID参数选取的一个新设计公式,以及关于一般仿射非线性不确定性系统的拓广PID反馈控制器(EPID)设计方法。

 

最后,郭雷院士介绍了一个更为基本的科学问题---反馈机制在应对非线性不确定动态系统时的最大能力与根本局限。他介绍了与合作者发现并证明的几个基本的关于反馈机制最大能力的临界性定理,并指出,借助随机动态系统的条件Cramer-Rao不等式可以研究反馈机制的根本局限,而通过在线学习与反馈控制的有机结合可以使得反馈机制达到其最大能力。毫无疑问,这项研究从基础理论上深化了对智能系统中反馈机制作用的认识.

 

这次报告中所提供的基本思想和结果有望为进一步促进机器学习与反馈控制的深入结合提供借鉴与启发,推动在不确定性情形下智能系统基础理论研究的深入发展。

 

报告人简介:郭雷,1982年毕业于山东大学数学系,1987年在中科院系统科学所获得博士学位,现任中科院数学与系统科学研究院研究员、中科院国家数学与交叉科学中心主任。曾任中科院数学与系统科学研究院院长、中国工业与应用数学会理事长等。主要从事系统与控制领域的基础理论及相关应用研究,特别是自适应系统(包括自适应估计、自适应滤波、自适应控制、自适应博弈)、非线性不确定系统控制、反馈机制最大能力、大群体系统集体行为、博弈控制系统和复杂系统科学等方面的研究。因为在相关研究领域的创新性、突破性和基础性贡献,他先后获得国内外一系列重要学术奖励和学术荣誉。1998年当选美国IEEE会士,2001年当选中国科学院院士。随后当选发展中国家科学院院士,瑞典皇家工程科学院外籍院士,国际自动控制联合会会士,并被瑞典皇家理工学院(KTH)授予荣誉博士学位。2019年获得IEEE控制系统学会颁发的最高奖“波德奖”(Hendrik W. Bode Lecture Prize),获奖理由是“因对自适应控制、系统辨识、自适应信号处理、随机系统及应用数学领域的根本性和实际性贡献”。他曾多次应邀在控制与数学领域顶级国际学术会议上做特邀报告,包括先后两次在三年一度的国际自动控制联合会(IFAC)世界大会上的大会报告(1999,2014),IEEE决策与控制会议(CDC)的大会报告(2019),四年一度的国际数学家大会(ICM)的邀请报告,以及本次国际工业与应用数学大会(ICIAM)的邀请报告等。

相关推荐: