艾博士：深入浅出大语言模型

编号:: wx1204376271

销售价:: ￥55.80; (市场价: ~~￥69.00~~)

赠送积分:: 56

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

"本书设计了博学的艾博士和好学的小明两个人物，以师徒二人对话的方式，由浅入深地讲解大语言模型相关内容的基本原理，讲解详细，通俗易懂，给读者以在教室上课的真实感。本书首先对大语言模型中用到的数学基础做了简要介绍，以方便读者学习；其次对神经网络与深度学习进行了详细讲解，这对于后续学习和理解大语言模型很有帮助；再次详细讲解Transformer架构；最后深入讲解GPT、BERT等具体的模型，以及强化学习方法、PPO算法和基于人类反馈的强化学习方法等。

本书适合于对大语言模型感兴趣的初学者、从事人工智能相关研发的工程技术人员，以及讲授相关课程的教师阅读。
"

目录

第1章什么是大语言模型

1.1大语言模型简介

1.2大语言模型应用

1.3总结

第2章预备知识

2.1矩阵和向量的基础知识

2.1.1矩阵

2.1.2向量

2.2数学期望与方差

2.3马尔可夫过程

2.4总结

第3章神经元与神经网络

3.1从数字识别谈起

3.2神经元

3.3神经网络

3.4反向传播算法

3.5卷积神经网络

3.6残差神经网络

3.7词向量

3.7.1词的向量表示

3.7.2神经网络语言模型

3.7.3word2vec模型

3.8循环神经网络

3.9长短期记忆网络

3.10总结

第4章Transformer模型

4.1序列到序列问题

4.2注意力机制

4.2.1什么是注意力机制

4.2.2自注意力机制

4.2.3多头注意力机制

4.3残差连接

4.4层归一化

4.5Transformer模型

4.5.1Transformer模型的编码器

4.5.2Transformer模型的解码器

4.5.3Transformer模型的训练

4.5.4位置编码

4.5.5层归一化的位置

4.5.6词元化方法

4.6总结

第5章GPT模型

5.1预训练模型

5.2GPT1模型

5.2.1GPT1模型的基本构成

5.2.2GPT1预训练过程

5.2.3GPT1微调过程

5.2.4GPT1模型的应用

5.2.5GPT1性能分析

5.3GPT2模型

5.3.1GPT2模型的基本构成

5.3.2GPT2 性能评价

5.4GPT3模型

5.4.1GPT3模型的基本构成

5.4.2数据集

5.4.3语境学习

5.4.4语境学习性能评价

5.5ChatGPT模型

5.6总结

第6章BERT模型

6.1BERT模型架构

6.2BERT模型的输入

6.3BERT模型的预训练方法

6.3.1MLM方法

6.3.2NSP方法

6.4BERT模型的微调方法

6.4.1句对分类任务

6.4.2单句分类任务

6.4.3文本问答任务

6.4.4单句标注任务

6.5总结

第7章强化学习方法

7.1什么是强化学习

7.2策略梯度方法

7.3演员评论家方法

7.3.1策略梯度方法存在的问题

7.3.2优势函数

7.3.3演员评论家方法的实现

7.3.4广义优势估计

7.3.5评论家模型

7.4基于异策略的演员评论家方法

7.4.1重要性采样

7.4.2近端策略优化算法

7.5总结

第8章基于人类反馈的强化学习方法

8.1学习如何回答问题

8.2学习人类偏好

8.3按人类偏好优化模型

8.4总结

第9章大语言模型的应用：提示工程

9.1应用准备

9.2提示词写作指南

9.3大语言模型应用举例

9.4DeepSeek使用简介

9.5总结

商品参数

基本信息
出版社	清华大学出版社
ISBN	9787302713630
条码	9787302713630
编者	马少平著
译者	--
出版年月	2026-05-01 00:00:00.0
开本	其他
装帧	平装
页数	231
字数	354
版次	1
印次	1
纸张	一般胶版纸

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]