暂无商品咨询信息 [发表商品咨询]
本书深入探讨了强化学习在现实世界应用中面临的安全挑战,特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法,区分奖励函数与安全相关的成本函数,以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题,开发了相应的算法。本书不仅贡献了相关安全强化学习算法理论,也为实践中强化学习的安全应用提供了全面的算法支持,同时展望了元学习及无重置学习等技术,以求安全理论的进一步突破,为追求更安全、可靠的强化学习应用奠定基础。
暂无
基本信息 | |
---|---|
出版社 | 国防工业出版社 |
ISBN | 9787118137071 |
条码 | 9787118137071 |
编者 | 杨奇松,常燕,武健,李邦杰,王顺宏,赵久奋 著 |
译者 | |
出版年月 | 2025-07-01 00:00:00.0 |
开本 | 其他 |
装帧 | 平装 |
页数 | 132 |
字数 | 136000 |
版次 | 1 |
印次 | 1 |
纸张 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]