暂无商品咨询信息 [发表商品咨询]
"本书从大型模型的结构讲起,让读者了解大型模型的内部实现原理,然后讲解如何在特定任务下对大型模型进行预训练、有监督的微调,以及进行强化学习。通过对模型采用不同方法的训练,持续改进模型在特定任务上的性能。最后,本书将与读者一起探讨如何利用大型模型开发大模型时代的智能应用。
本书共9章,第1章讲解大型模型发展的历史及其带来的变革。第2章深入讲解大型模型内部结构的演进。第3章会尝试自己运行一个大模型。第4章介绍大型模型对模型训练和推理过程中带来的技术挑战和解决办法。第5章讲解如何进行大型模型的预训练以获取大模型的基本能力。第6章讲解如何对大模型进行有监督的微调,使大型模型输出与人类意图对齐。第7章讲解如何通过强化学习进一步提升大型模型的表现。第8章讲解如何对大模型进行评估。第9章讲解如何利用大模型构建智能应用。
本书适合有一定深度学习基础的读者,帮助他们从原理到应用,快速了解大型模型的原理、训练方法,并利用大型模型进行智能应用的开发。
"
基本信息 | |
---|---|
出版社 | 清华大学出版社 |
ISBN | 9787302695776 |
条码 | 9787302695776 |
编者 | 薛鹏 著 |
译者 | -- |
出版年月 | 2025-07-01 00:00:00.0 |
开本 | 其他 |
装帧 | 平装 |
页数 | 0 |
字数 | 419 |
版次 | 1 |
印次 | 1 |
纸张 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]