英语词典
This paper elaborates on the low learning efficiency in reinforcement learning due to improper generalization and random exploration policy under deterministic MDPS and proposes a hierarchical reinforcement learning algorithm based on system model.
针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题,本文提出基于模型的层次化强化学习算法。
互联网摘选
英语网英语词典(dict.25820.com)为您提供在线翻译、英语词典、单词大全、英译汉、汉译英等英语服务!可按单词头尾、字数和词义分类查询。支持lj:关键词格式查询例句。