近日,我院刘久兵副教授与合作者南京大学工程管理学院孙宇祥助理研究员在人工智能与模糊系统领域顶级期刊《IEEE Transactions on Fuzzy Systems》(中文译名《IEEE模糊系统汇刊》,中科院一区TOP期刊,2023年影响因子为10.7)上发表了题为“Intuitionistic Fuzzy MADM in Wargames Leveraging With Deep Reinforcement Learning”的研究论文。该论文得到国家自然科学基金青年项目(编号:62106135、62073160)、广东省自然科学基金面上项目(编号:2023A1515011390)和教育部人文社科青年项目(编号:23YJC630156)资助。
论文简介
针对智能兵棋推演训练的收敛速度慢和Agent在特定规则下的学习成功率低问题,论文提出基于IFNDM-PPO的兵棋博弈对抗模型与算法。首先,在兵棋仿真平台上利用所提出的算法进行仿真对抗实验,以便获取红蓝原始对抗数据。其次,利用实数、区间数和直觉模糊数分别对原始对抗数据进行表征,并统一量化为直觉模糊数据类型,然后利用直觉模糊粗糙集相似度计算目标威胁值及直觉模糊粗糙信息熵,进而评估对手威胁度。再次,构建基于威胁度的强化学习奖赏函数及PPO框架训练模型,从而提出基于IFNDM-PPO的模型与算法,并在仿真平台上进行验证。
仿真结果表明:相比现有最新强化学习算法,所提出的模型与算法可在短时间内完成训练且奖励值得到稳步提升,并最终获胜率可达到76.5%(详见Figure 4),同时能有效解决现有算法收敛速度慢和学习成功率低问题。
Figure 4. Average winning rate of 5 algorithms performed 5 times
期刊简介
《IEEE Transactions on Fuzzy Systems》是人工智能、模糊系统、工程应用及与运筹管理等交叉领域的顶级期刊之一,致力于发表模糊数学、控制论、人工智能、决策分析等领域具有重要理论意义和应用价值的研究成果。期刊最新影响因子为10.7,为中科院一区TOP期刊。
通讯作者介绍
刘久兵,江西瑞金人,管理学博士(南京大学)、汕头大学副教授、硕士生导师、加拿大Regina大学访问学者,入选汕头市高层次人才、校卓越计划优秀人才(2022-2025)、优秀青年人才(2019-2022),主要研究数据驱动决策、优化运筹、粒计算和数学建模。以第一作者或通讯作者在《IEEE Transactions on Cybernetics》、《IEEE Transactions on Fuzzy Systems》(2篇)、《Information Sciences》(4篇)、《Applied Soft Computing》、《International Journal of Approximate Reasoning》、《Journal of Intelligent and Fuzzy Systems》、《系统工程理论与实践》、《运筹与管理》等重要期刊发表论文27篇,高被引3篇。主持国家自科青年、省自科面上、青年和省社科青年项目等8项(结题6项),参与完成国家级项目2项。担任教育部学位论文通讯评审专家、中国人工智能学会粒计算与知识发现专委会委员、CCF高级会员。曾获全国总决赛优秀指导教师奖、“中国粒计算与知识发现学术会议”优秀论文奖、博士研究生国家奖学金、硕士研究生国家奖学金、本科国家奖学金、全国研究生数学建模竞赛国家二等奖、全国大学生数学竞赛(数学专业组)省一等奖和汕头大学“优秀共产党员”。指导学生获全国大学生数学建模竞赛等包括国家一等奖(4项)、国家二等奖(3项)、国家三等奖等40项,指导硕士生获“2023中国粒计算与知识发现学术会议”优秀论文奖。目前担任IEEE TNNLS、IEEE TCYB、IEEE TFS、IEEE SMCA、Applied Energy、INS、ESWA、ASOC、IJAR、IJMLC、《系统工程理论与实践》、《计算机学报》等30余种期刊及多个学术会议审稿人。
来源:科研与研究生办公室
编辑:马雪丽
初审:黄金
复审:林泽锋
终审:郭功星