基于强化学习和角度惩罚距离的冰晶连续优化算法

TP18; 针对全局连续优化问题,提出了一种基于强化学习的概率更新和角度惩罚距离偏差策略的冰晶连续优化算法.首先,通过模拟湖水结冰的自然现象,提出了冰晶连续优化算法,实现对连续极值问题的求解.在选择湖水中心时,加入的角度惩罚距离能更好地平衡收敛性和多样性,消除临时湖水中心带来的能量计算误差;然后,基于强化学习的概率更新可以对新生晶体的位置有更好的引导效果,加快湖水的结冰过程,更快地逼近湖水中心?全局最优点;最后,为了验证概率更新和角度惩罚距离的有效性,对加入概率更新策略前后的算法进行了比较.将本文算法与其他4种算法在12个基准函数上进行了比较,验证了算法的有效性....

Full description

Saved in:

Bibliographic Details
Published in	华东理工大学学报（自然科学版） Vol. 47; no. 1; pp. 89 - 100
Main Authors	许毅, 冯翔, 虞慧群
Format	Journal Article
Language	Chinese
Published	上海智慧能源工程技术研究中心,上海 200237 2021 华东理工大学信息科学与工程学院,上海 200237%华东理工大学信息科学与工程学院,上海 200237
Subjects	优化问题强化学习冰晶连续优化算法角度惩罚距离
Online Access	Get full text

Cover

Loading…

More Information
Summary:	TP18; 针对全局连续优化问题,提出了一种基于强化学习的概率更新和角度惩罚距离偏差策略的冰晶连续优化算法.首先,通过模拟湖水结冰的自然现象,提出了冰晶连续优化算法,实现对连续极值问题的求解.在选择湖水中心时,加入的角度惩罚距离能更好地平衡收敛性和多样性,消除临时湖水中心带来的能量计算误差;然后,基于强化学习的概率更新可以对新生晶体的位置有更好的引导效果,加快湖水的结冰过程,更快地逼近湖水中心?全局最优点;最后,为了验证概率更新和角度惩罚距离的有效性,对加入概率更新策略前后的算法进行了比较.将本文算法与其他4种算法在12个基准函数上进行了比较,验证了算法的有效性.
ISSN:	1006-3080
DOI:	10.14135/j.cnki.1006-3080.20191125003