热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

异策略安全约束强化学习

编号:
wx1203719746
销售价:
¥73.04
(市场价: ¥88.00)
赠送积分:
73
数量:
   
商品介绍

本书深入探讨了强化学习在现实世界应用中面临的安全挑战,特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法,区分奖励函数与安全相关的成本函数,以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题,开发了相应的算法。本书不仅贡献了相关安全强化学习算法理论,也为实践中强化学习的安全应用提供了全面的算法支持,同时展望了元学习及无重置学习等技术,以求安全理论的进一步突破,为追求更安全、可靠的强化学习应用奠定基础。

暂无

商品参数
基本信息
出版社 国防工业出版社
ISBN 9787118137071
条码 9787118137071
编者 杨奇松,常燕,武健,李邦杰,王顺宏,赵久奋 著
译者
出版年月 2025-07-01 00:00:00.0
开本 其他
装帧 平装
页数 132
字数 136000
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]