中南大学学报(自然科学版)

基于多Agent的分布式智能防空指挥决策系统

陈继真1,李玉萍2,李世华1, 2,章国宝1

(1. 东南大学 自动化学院,江苏 南京,210096;2. C4ISR技术国防科技重点实验室,江苏 南京,210007)

摘 要:

统是一个分布、异构、松散耦合的复杂分布式人工智能控制系统,基于多Agent的协同决策系统是实现联合作战指挥控制系统的有效方法。通过研究传统的作战仿真模型,对Agent理论在实时作战指挥决策中的可行性进行分析之后,提出了基于多Agent的协同作战决策模型,并对防空智能决策支持系统进行初步设计,最后分析该决策模型在实时作战环境中的适应性和决策效率。

关键词:

协同防空指挥控制多智能体适应性

中图分类号:E072          文献标志码:A         文章编号:1672-7207(2011)S1-0841-06

Distributed intelligent air-defense command and decision system based on multi-agent

CHEN Ji-zhen1, LI Yu-ping2, LI Shi-hua1, 2, ZHANG Guo-bao1

(1. School of Automation, Southeast University, Nanjing 210096, China;

2. National Key Laboratory of Science and Technology on C4ISR, Nanjing 210007, China)

Abstract: Air-defense command and decision system is a distributed, heterogeneous, loosely coupled, and complex artificial intelligent control system. Collaborative decision-making based on multi-agent system is an effective way to achieve joint operational command and control system. By studying the traditional combat simulation model, a coordinated operation decision model was proposed based on multi-agent, and the intelligent air-defense decision support system framework was given. Finally, the adaptability and decision-making efficiency of the decision-making model in real-time combat environment were analyzed.

Key words: cooperative air defense; command and control; multi-agent system (MAS); adaptability

随着航空技术的发展,信息化条件下的现代防空指挥作为一个动态的复杂决策过程,呈现出作战力量多样、海陆空战争空间多维和强实时性等特征[1]。未来的空战具有如下特点:

(1) 群体性。现代战争由单兵作战转化为多兵种联合作战,指挥决策将要通过决策成员协调完成军事行动。

(2) 分布性。通信技术和航空、航海技术的发展使现代战场进一步扩大,因此,作战系统将呈现空间上的分布性。

(3) 实时性。防空舰艇指挥系统在敌方攻击之后,必须在很短的时间内做出躲避和反攻的决策,如果系统不能满足实时性的要求,将会给我方带来灾难性的后果。

(4) 动态复杂性。现代空战通常发生在广阔的空间中,防空指挥系统必须适应战场环境的变化。

现代防空指挥决策改变了传统的作战方式,突破了传统战争时间和空间的限制。防空指挥决策自动化将成为未来战争的需求。文献[2-3]分析了以平台为中心的传统作战系统,并提出了作战系统从平台中心战向网络中心战的过渡。平台中心战的战斗行为主要以武器平台来进行,各平台自主指挥作战单元进行战斗,获取战场信息,其优点是有利于实施独立作战,对战场变化做出实时反应。但是,平台中心战限制了各平台之间的协作与信息的共享,消耗大量系统资源。文献[4-5]指出网络通信技术的发展使这种作战平台之间的过渡成为可能,通过系统的统筹指挥决策,协调系统资源分配,完成C4ISR系统中的指挥、控制、通信、计算、情报、监视、侦察等一系列任务。因此,如何建立一个高效的通信机制和协作机制成为后续工作的研究重点。文献[6]则对现代作战力量从单兵种、合同作战向多军种联合作战的过渡进行了研究。提出联合作战的定义:面对复杂战场环境,当单一军力无法完成军事任务,以某一军种作为战局的领导者,其他军种进行配合作战。通过通信网络将作战部队联合起来,各军种由战局领导者统一进行协调指挥。文献[7-9]指出传统的防空决策支持系统,大多是建立在数学方程之上的模型。常见的模型是基于Lanchester方程的C4ISR系统解析模型,以及基于系统动力学的C4ISR系统微分方程模型。此类模型在描述战争中的复杂态势变化时存在局限性,只有通过人为的修正Lanchester方程的损耗系数来改变战局,但是,无法刻画战争中战术变化以及人在作战过程中斗志、欲望等精神因素对战局的影响。

本文将主要研究基于多Agent 的分布式智能防空指挥决策系统。通过对防空指挥决策过程的分析,将多Agent理论引入到防空指挥决策系统,提出了适应作战的单个决策Agent组成结构和控制模型,针对协同防空决策过程中各作战单元之间如何协同的关键问题,将作战个体成员抽象为决策智能体,基于智能体系统规划,提出一个面向协同防空决策的多智能体通信拓扑网络,在降低通信成本的同时有效地提高智能体之间的通信效率。最后对该分布式智能防空智能指挥决策框架进行了系统适应性和决策效率方面的性能分析。

1  防空指挥决策分析

现代防空作战依赖雷达、军事卫星等情报来源,使用战斗机、地空导弹、高射炮一类武器来防备、抵御敌方的空中袭击。将防空指挥决策过程分为目标识别和威胁估计、指挥决策、目标火力协调分配、决策执行4个部分。如图1所示。

图1  防空指挥决策过程

Fig.1  Air defense command and decision process

目标识别是整个指挥决策的前提。通过巡逻预警机收集雷达、军事卫星情报并进行信息融合处理,判断空中目标的敌我属性和机型,为后续决策行为打下基础。威胁估计也称为态势估计,主要任务是通过第一步所得出的结果判断和预测敌机将要攻击的我方目标、达到我方目标被攻击区域的时间以及我方各目标的受威胁程度,是后期目标火力分配的决策依据。

指挥决策是整个作战过程中最重要的环节。决策者需要根据己方的作战需求,从备选方案中选出最优作战方案,并从制定作战计划。

火力分配是借助计算机等辅助决策工具,计算敌我双方在武器装备上的实力对比,运用己方有限的攻击资源对多个敌方空中目标进行有效拦截,达到武器和数量的最佳分配。

决策执行是指挥决策系统根据决策者选择的作战方案和态势估计,作战系统迅速进行计算,形成作战指令,借助通信网络传输到作战单元,如战斗机、舰艇等。

随着科学技术在军事中的应用,高科技武器和兵力的多样性使现代防空指挥决策面临着一系列复杂问题。军事战场环境的复杂性和多兵种协同作战,控制战局的难度越来越大。所有这些变化对指挥者提出了更高的要求,依赖计算机系统的指挥决策支持系统应运而生。

2  指挥决策支持系统的智能体

Agent概念是由MIT的著名计算机学家及人工智能学科创始人之一Minsky提出的,他的“Society of Mind”一书将社会与社会行为概念引入计算系统。认为智能Agent是指能在某一环境中运行,能响应并适应环境变化,灵活、自主地采取行动以实现其既定目标的软件实体。在不同的应用领域,Agent有着不同的定义[10-11]。关于Agent的弱定义得到大多数学者的认可,他们认为Agent有以下4个基本特征:

(1) 自主性。智能Agent是一个独立自主的实体,在不需要外界的干预和直接介入的情况下,Agent能够控制自身的状态,并对外部世界的变化做出反应。

(2) 社会性。Agent可以通过通信与其它同类进行交互,不会处于孤立的环境当中。

(3) 反应性。Agent拥有自身的知识库,可以获取外界信息,做出预测判断,对环境的变化作出及时的反应。

(4) 主动性。当Agent接受任务后,在某一目标的指导下,具有主动行为,使自身和整个系统的收益达到最大化。

除以上4个基本特性之外,我们赋予了智能Agent更多人的特性。在指挥决策系统中,Agent将拥有战争领域的专业知识、斗志、信念以及战争中的主动协作。

分布式智能防空指挥决策系统中Agent的一般结构如图2所示。主要由以下模块组成:用户界面、推理机、通讯模块、决策模块、学习模块以及知识库。防空指挥决策中Agent通过传感器或者通信模块接受外界信息,然后再通过内部规则对信息进行分类、融合等一系列处理,自身求解推理模块依据这些信息作出反应,并最终通过决策模块输出影响外界环境。在指挥决策过程中,各Agent不断地进行自学习,为知识库增加新的知识、对新的问题和新的决策方法进行总结:更新自身的数据库和知识库使指挥者在今后面对同样的决策问题时有据可循,提高系统在复杂未知环境下的适应性。

图2  防空Agent基本框架

Fig.2  Framework of anti-aircraft agent

3  基于Agent的分布式智能防空指挥决策系统

3.1  系统框架

多武器军种协同防空指挥决策系统是一个异构、松散耦合的复杂分布式人工智能控制系统。本文应用多智能体技术提出基于Agent的分布式智能防空指挥决策系统框架,如图3所示。

防空指挥决策系统中各自角色的不同分为如下6大类Agent:情报预警Agent、信息融合Agent、决策推理Agent、指挥决策Agent、协同决策Agent、武器执行Agent。在现代通信网络技术的支持下,该系统满足了现代防空作战在空间区域上的分散性的要求,提供多个小型分布式决策平台信息资源共享,可以实现远程防空攻击。异构Agent之间的协作使以传统平台为中心的防空体系转化为以网络为中心的协同指挥决策系统。

3.2  基于多Agent的分布式智能防空指挥决策步骤

指挥决策包括防空作战的方向、作战目标、作战力量、作战战术等方面的决策,因此,决策时效性和准确性对战场进程和结局具有重要影响。防空指挥决策必须通过一个系统化、有序的决策过程才能使防空作战有条不紊地进行。防空指挥决策由以下4个步骤组成。

图3  基于Agent的防空指挥决策系统框架

Fig.3  Agent-based air defense command and decision-making framework

 (1) 决策任务形成。这一决策步骤包括:情报收集、目标识别、威胁估计。在现代防空指挥决策中,各决策子系统处于备战状态。情报预警Agent如:卫星Agent、预警机Agent、雷达Agent等信息源对各自防御区域进行“地毯式”的探测与搜索,通过Agent之间的交互,实现单位时间内指挥决策搜索范围的最  大化。

(2) 决策方案的形成。这个步骤是由指挥决策者和计算机系统共同完成的。依赖决策系统经验知识,决策推理Agent对第一步骤中提交的决策任务进行推理,将复杂任务分解为相互关联、耦合的小任务。根据防空系统自身能力和决策任务要求形成备选决策 方案。

(3) 决策方案的评估。在初步备选方案形成之后,指挥者依据自身系统防空决策要求选择一个效用值最高的备选方案作为最终的行动方案。指挥者做出决策将依照以下标准:防空决策的成功率;决策效益的优劣;防空决策实施的难度;决策方案的适应性。

(4) 决策任务的协调分配与执行。在决策方案按照上述4个评价标准进行优劣排序之后,指挥者选择首选方案和备选方案,决策推理Agent根据自身战斗力量和现实战场情况,将决策任务分解为相互关联、相互耦合的小任务,运用合同协议网理论,通过放标、投标、竞标的模式将小任务分配给防空系统中的武器Agent。

以上4个决策步骤形成了整个防空指挥决策的全过程。武器Agent在执行任务的过程中,通过其自身的传感器模块收集战场信息,提交给情报预警系统更新数据库,同时将任务执行效果反馈给指挥决策系统。这样就形成了一个完整的防空指挥决策过程。

4  基于Agent的分布式智能防空指挥决策系统性能分析

相比于传统的以平台为中心的防空指挥决策系统,Gerhard[12]对分布式的人工智能决策做出了初步研究。本文提出的基于Agent的分布式防空指挥决策系统在系统的适应性和决策效率等性能方面有显著的优势。下面将对这2方面的性能对指挥决策系统进行  分析。

4.1  适应能力

防空指挥决策系统的适应性是指在面对动态变化的战场环境以及决策目标改变时,系统能在有限的时间内作出反应。这就需要提高系统中Agent的学习能力。系统的适应能力也体现在Agent的知识库上,要提高系统的适应能力就需要提高系统在决策过程中的学习能力。

4.1.1  Agent的学习能力

基于多Agent的防空指挥决策系统中各Agent在学习的过程中,以完成某项特定的防空任务为共同目标。因此,随着系统中各Agent功能和扮演角色的不同,在完成系统决策任务的前提下,努力完成自身决策学习。那么不同的Agent具有不同的学习目标和学习方法。例如:情报预警Agent在收集战场信息时学习在系统和信息源干扰的情况下,如何通过Agent的协作避免搜索区域的空洞并实现单位时间内搜索区域的最大化,建立Agent之间的良好的情报协作关系,降低系统消耗。信息融合Agent需要学习在信息融合过程中如何处理局部信息融合和全局信息融合,适应环境的动态变化。协同Agent需要对指挥决策Agent所作出的决策进行自学习,并学习如何在全局和局部态势下进行任务分配。武器Agent需要学习在战场情形下如何选择进攻目标、战术协作以及火力分配。

4.1.2  Agent准入与退出机制

在指挥作战过程中,完善的Agent准入与退出机制能使系统更好地适应动态战争环境。在防空决策局部战场,当敌我双方战斗力量出现敌强我弱时,我军武器Agent会向指挥决策Agent反馈战局信息,并请求其他兵力的援助,以实现敌我双方在战斗力量上的均衡,在多机协同的基础上规范Agent的准入机制;同时,指挥决策系统允许Agent退出整个协同工作网或者完全消失,而不会影响到整个网络的通信和系统的正常运行,这样就可以节约系统资源,同时也提高了系统在动态变化环境中的适应性。

4.2  决策效率

随着战争科技的发展,战斗机的飞行速度越来越快,其装载武器设备越来越先进,远程导弹和巡航导弹的大量应用使防空决策战场态势瞬息万变,因此,防空指挥决策系统的决策效率尤为重要。基于多Agent的防空指挥决策系统通过优化Agent间通信和完善异构武器之间的协作机制来达到提高系统的决策效率的目的。

4.2.1  Agent间通信

本文提出在基于多Agent的防空指挥决策系统中采用混合结构的通信模式,如图4所示。

图4  基于Agent的防空指挥决策系统通信网络

Fig.4  Agent-based air defense command and decision-making system communication network

从图4可以看出,基于Agent防空指挥决策系统采取分层通信的策略。整个系统的通信网络分为4层:最高决策层、全局决策层、局部决策层、战斗个体层。在相同层次上的作战单位可以自由通信,并共享各类资源。上级可直接向下一级直接传达决策指令,并且下一级单位可以向上级反映战场情况;不能越级通信。这种通信模式可以降低系统消耗,提高系统通信效率,进而提高系统的问题求解效率。

己方Agent的通信采用黑板模式进行通讯。情报预警Agent在通信黑板上公布收集到的情报和自己的通信地址,需要情报的决策Agent将在通信黑板上搜索自己需要的信息,建立信息供给与需求合作关系,采用同步通信与异步通信提高系统的通信效率。从图4可以看出,武器指挥Agent与情报预警Agent之间采取同步通信的模式,以便及时传递战场信息;指挥决策Agent与协调Agent之间以及指挥决策Agent与个体作战Agent之间采取同步通信与异步通信相结合的模式,用于传递决策指令。

4.2.2  Agent的协作机制

防空指挥决策中的协作有2个方面:同类智能体间的协作和异类智能体之间的协作。同类智能体之间的协作主要是指同类智能体内部之间的协作,完成该类别智能体本职的任务:收集战场信息并进行目标识别和威胁估计;武器Agent执行上层指挥者的决策,对敌方目标进行攻击。

异构智能体间的协作以同类智能体间的协作方式作为基础,防空指挥决策体系中的异构智能体之间的协作具体有以下几种形式。

(1) 雷达、卫星、预警机之间的协作。情报预警系统中的职能Agent在执行情报收集任务时,需要考虑其他情报Agent的位置以及状态,与其他Agent采取搜索协同,使任意2个搜索Agent的搜索区域中重叠的部分最少,以实现搜索范围和搜索时间的最优。

(2) 海陆空作战Agent之间的协作。在作战过程中,庞大的作战任务使得单一种类的作战Agent难以完成。为使己方在作战中的损失达到最少,或者使敌方的损失最大,作战Agent采取作战协同。例如:在需要进行远程攻击时,由于飞行距离的原因,单纯的运用战斗机无法独自完成作战任务,战斗机Agent将向舰艇Agent发出合作请求,舰艇Agent根据自身所处的战场情况来判断是否接受协作请求,一旦协作双方达成协作,将实施远程攻击。

(3) 情报Agent与作战Agent之间的协作。本文所设计的作战Agent同样具有收集战场信息的能力,作战Agent可以代替情报Agent的角色,收集战场   信息。

5  结论

在分析多机空战决策问题的基础上,研究了Agent理论在实时防空指挥决策中的可行性。并提出了一个基于多Agent的分布式智能指挥决策系统。在该系统中,按其角色分为情报预警Agent、单机自主战术决策Agent 和协同决策Agent等。对该系统在复杂实时环境下的适应性以及决策效率进行了深入分析。提出了四层通信拓扑网络,该通信网络在降低系统消耗的同时,提高了Agent之间的通信效率;随着系统的不断运行,各个Agent通过学习不断地获取知识,完善知识库来提高自己的决策能力,使系统的决策支持水平得到提高。

参考文献:

[1] Grecu D L, Gonsalves G. Agent-based simulation environment for UCAV mission planning and execution[C]//American Institute of Aeronautics and Astronautics Guidance, Navigation, and Control Conference. Denver: Charles River Analytic, Inc, 2000.

[2] Joglekar N A. Test strategy for net-centric C4ISR system[J]. ITEA Journal, 2008, 29: 289-293.

[3] Alberts. Network centric warfare: Developing and leveraging information superiority[M]. 2th Edition. Washington D.C.: CCRP Serials Publication, 2000: 102-200.

[4] HU Xiao-feng, LUO Pi. War complexity and war gaming and simulation[J]. National Defense Science & Technology, 2007(2): 6-11.

[5] 黄力. C4ISR 体系结构框架研究进展[J]. 火力与指挥控制, 2004, 29(3): 16-23.
HUANG Li. Advances on C4ISR architecture framework[J]. Fire Control & Command Control, 2004, 29(3): 16-23.

[6] 胡国桥. 作战指挥前沿理论研究[M]. 北京: 国防大学出版社, 2000: 200.
HU Guo-qiao. Research on advanced theory of combat command[M]. Beijing: National Defense University Press, 2000: 200.

[7] 齐艳平. 陆军诸兵种合同作战兰切斯特方程的弹药消耗预测研究[J]. 军械工程学院学报, 2004, 16(5): 56-61.
QI Yan-ping. Ammunition consumption forecast based lanchester equation of cooperative operations with multi-arms[J]. Journal of Ordnance Engineering College, 2004, 16(5): 56-61.

[8] Starr S H. C4ISR Assessment: Past, present, and future[C]// International Command and Control Research and Technology Symposium. Washington D.C.: National Defense University, 2003: 17-19.

[9] 刘金星, 佟明安. 协同空战指挥控制系统智能体模型研究[J]. 火力与指挥控制, 2003, 28(2): 10-12.
LIU Jing-xing, TONG Ming-an. Study on the models of cooperative air combat command control system based-on agent[J]. Fire Control & Command Control, 2003, 28(2): 10-12.

[10] Melgar I, Fombellida J, Jevti? A, et al. Swarm architectures for ground-based air defense systems of systems[C]//7th IEEE International Conference on Industrial Informatics. Piscatuaway, NJ: IEEE Press, 2009: 783-788.

[11] Wooldridge M, Jennings N R. Intelligent agents: theory and practice[J]. Knowledge Engineering Review, 1995, 10(2): 115- 152.

[12] Gerhard W. Multi-agent systems: A modern approach to distributed artificial intelligence[M]. Cambridge, MA: MIT Press, 1999.

(编辑 袁赛前)

收稿日期:2011-04-15;修回日期:2011-06-15

基金项目:国防科技重点实验室基金资助项目(9140C8301011001)

通信作者:李世华(1975-),男,江西萍乡人,教授,博士生导师,从事非线性系统的分析与综合以及交流伺服系统控制方法等研究;电话:025-  83793785;E-mail: lsh@seu.edu.cn

摘要:防空指挥决策系统是一个分布、异构、松散耦合的复杂分布式人工智能控制系统,基于多Agent的协同决策系统是实现联合作战指挥控制系统的有效方法。通过研究传统的作战仿真模型,对Agent理论在实时作战指挥决策中的可行性进行分析之后,提出了基于多Agent的协同作战决策模型,并对防空智能决策支持系统进行初步设计,最后分析该决策模型在实时作战环境中的适应性和决策效率。

[1] Grecu D L, Gonsalves G. Agent-based simulation environment for UCAV mission planning and execution[C]//American Institute of Aeronautics and Astronautics Guidance, Navigation, and Control Conference. Denver: Charles River Analytic, Inc, 2000.

[2] Joglekar N A. Test strategy for net-centric C4ISR system[J]. ITEA Journal, 2008, 29: 289-293.

[3] Alberts. Network centric warfare: Developing and leveraging information superiority[M]. 2th Edition. Washington D.C.: CCRP Serials Publication, 2000: 102-200.

[4] HU Xiao-feng, LUO Pi. War complexity and war gaming and simulation[J]. National Defense Science & Technology, 2007(2): 6-11.

[5] 黄力. C4ISR 体系结构框架研究进展[J]. 火力与指挥控制, 2004, 29(3): 16-23.HUANG Li. Advances on C4ISR architecture framework[J]. Fire Control & Command Control, 2004, 29(3): 16-23.

[6] 胡国桥. 作战指挥前沿理论研究[M]. 北京: 国防大学出版社, 2000: 200.HU Guo-qiao. Research on advanced theory of combat command[M]. Beijing: National Defense University Press, 2000: 200.

[7] 齐艳平. 陆军诸兵种合同作战兰切斯特方程的弹药消耗预测研究[J]. 军械工程学院学报, 2004, 16(5): 56-61.QI Yan-ping. Ammunition consumption forecast based lanchester equation of cooperative operations with multi-arms[J]. Journal of Ordnance Engineering College, 2004, 16(5): 56-61.

[8] Starr S H. C4ISR Assessment: Past, present, and future[C]// International Command and Control Research and Technology Symposium. Washington D.C.: National Defense University, 2003: 17-19.

[9] 刘金星, 佟明安. 协同空战指挥控制系统智能体模型研究[J]. 火力与指挥控制, 2003, 28(2): 10-12.LIU Jing-xing, TONG Ming-an. Study on the models of cooperative air combat command control system based-on agent[J]. Fire Control & Command Control, 2003, 28(2): 10-12.

[10] Melgar I, Fombellida J, Jevti? A, et al. Swarm architectures for ground-based air defense systems of systems[C]//7th IEEE International Conference on Industrial Informatics. Piscatuaway, NJ: IEEE Press, 2009: 783-788.

[11] Wooldridge M, Jennings N R. Intelligent agents: theory and practice[J]. Knowledge Engineering Review, 1995, 10(2): 115- 152.

[12] Gerhard W. Multi-agent systems: A modern approach to distributed artificial intelligence[M]. Cambridge, MA: MIT Press, 1999.