暂无商品咨询信息 [发表商品咨询]
(1)打通完整Python开发链条:系统梳理大模型应用开发全流程,涵盖分词、词嵌入、向量数据库、提示词工程、模型微调与部署等关键技术,帮助开发者构建成体系的技能框架。
(2)主流工具一网打尽:聚焦Hugging Face、LangChain、RAG等当前最热门的大模型开发框架,讲解其原理与实操方法,配合可运行的代码与实战案例,快速上手、易于应用。
(3)项目实战导向,深度挖掘数字人场景:通过多个数字人电商项目实战,完整展示智能系统构建方式,贴近热门应用场景,增强实战价值与可落地性。
(4)内容循序渐进,初学与进阶开发者友好:全书由浅入深、结构清晰,从基础认知到高级实战,兼顾知识体系构建与动手能力提升,既适合AI开发初学者,也能帮助有经验的工程师补齐短板。
(5)作者技术实力深厚,经验提炼与代码实操双助力:作者倾力总结多年AI架构实战经验,结合真实项目中的痛点问题,提供一线开发技巧与工程化思维,帮助开发者在实践中掌握大模型开发的“术”与“道”。
这是一本聚焦Python大语言模型应用开发的实战指南。从基础知识出发,逐步深入讲解主流开发工具与关键技术,最终以当前热门的数字人电商直播项目为例,呈现完整的AI实战路径。
本书具有以下特色:
?由浅入深:本书各章节环环相扣,循序渐进,形成完整的知识体系。
?注重实战:本书注重实践,引导读者在解决实际项目问题的过程中掌握知识。
?内容新颖:本书均采用前沿、主流的技术和工具,使读者掌握先进的开发方法。
?经验总结:本书是对作者近10年工作经验的总结,对AI初学者具有极高的参考价值。
全书分为三篇,共15章,具体内容如下:
第一篇:基础知识(第1、2章)。本篇介绍大语言模型及其应用开发的基础知识,为后续章节的学习奠定坚实的基础。
第二篇:开发技术(第3~10章)。本篇涵盖分词技术、词嵌入技术、向量数据库、提示词工程与优化、Hugging Face 入门与开发、LangChain入门与开发、大语言模型微调,以及大语言模型的部署等内容。这些主题构成了大语言模型应用开发的核心技术体系,掌握这些技术对于深入开发大语言模型至关重要。
第三篇:项目实战(第11~15章)。本篇聚焦数字人电商直播应用,包括数字人口播台词生成、直播间问答分类、直播间互动问答,以及直播间数据分析Text2SQL等实战项目。这些内容基于当前热门的数字人应用开发,具有很高的实践价值和参考意义。
CONTENTS<br />目 录<br />前言<br />第一篇 基础知识<br />第1章 大语言模型2<br />1.1 大语言模型概述2<br />1.1.1 大语言模型的定义2<br />1.1.2 大语言模型的分类3<br />1.1.3 大语言模型的应用场景3<br />1.2 大语言模型的演变与发展4<br />1.2.1 大语言模型的网络架构演变4<br />1.2.2 大语言模型发展的关键事件6<br />1.3 大语言模型的基础知识7<br />1.3.1 什么是算力7<br />1.3.2 显卡的基础知识7<br />1.3.3 大语言模型的参数数量与精度9<br />1.3.4 大语言模型的基本单位10<br />1.3.5 通用人工智能11<br />1.4 小结12<br />第2章 Python大语言模型应用开发13<br />2.1 Python大语言模型应用开发的基础知识13<br />2.1.1 Python编程的基础知识13<br />2.1.2 接口的设计与优化21<br />2.1.3 大语言模型接口开发实战24<br />2.2 Docker容器的基础知识30<br />2.2.1 Docker基础命令30<br />2.2.2 Docker构建镜像32<br />2.2.3 Docker容器编排33<br />2.3 大语言模型与NLP34<br />2.3.1 NLP的研究任务34<br />2.3.2 传统NLP的技术实现路径35<br />2.3.3 大语言模型对传统NLP的影响36<br />2.4 小结36<br />第二篇 开发技术<br />第3章 分词技术38<br />3.1 分词38<br />3.1.1 什么是分词38<br />3.1.2 英文分词39<br />3.1.3 中文分词41<br />3.1.4 制作词云图44<br />3.2 常见的分词算法45<br />3.2.1 基于规则的分词算法46<br />3.2.2 基于统计的分词算法48<br />3.2.3 基于深度学习的分词算法50<br />3.2.4 基于预训练语言模型的分词算法51<br />3.3 使用大语言模型进行分词51<br />3.3.1 基于ChatGPT服务的分词51<br />3.3.2 基于本地大语言模型的分词52<br />3.4 小结53<br />第4章 词嵌入技术54<br />4.1 词袋模型54<br />4.1.1 词袋模型的基本概念和原理54<br />4.1.2 词袋模型的构建55<br />4.2 词向量模型57<br />4.2.1 One-Hot编码58<br />4.2.2 Word2Vec模型59<br />4.3 大语言模型生成Embedding61<br />4.3.1 使用ChatGPT生成Embedding61<br />4.3.2 使用Text2Vec生成Embedding63<br />4.3.3 使用sentence-transformers生成Embedding64<br />4.3.4 使用Transformers库生成Embedding64<br />4.3.5 统计输入文本的Token数65<br />4.4 大语言模型的Embedding应用66<br />4.4.1 Embedding数据集准备67<br />4.4.2 Embedding数据2D可视化68<br />4.4.3 Embedding中文相似度计算68<br />4.5 小结70<br />第5章 向量数据库71<br />5.1 向量数据库简介71<br />5.1.1 向量数据库的缘起71<br />5.1.2 向量数据库的特点72<br />5.1.3 与传统数据库的比较72<br />5.1.4 向量数据库的应用场景73<br />5.2 向量数据库的原理73<br />5.2.1 向量距离的度量74<br />5.2.2 相似度搜索算法75<br />5.3 向量数据库的应用76<br />5.3.1 FAISS向量数据库入门76<br />5.3.2 FAISS的相似度度量78<br />5.3.3 FAISS的索引分类78<br />5.3.4 FAISS的索引创建与操作79<br />5.3.5 FAISS的优化80<br />5.4 小结80<br />第6章 提示词工程与优化81<br />6.1 认识提示词工程81<br />6.1.1 人机交互的演进81<br />6.1.2 什么是提示词82<br />6.1.3 提示词工程82<br />6.2 提示词工程的使用技巧83<br />6.2.1 使用文本分隔符83<br />6.2.2 赋予模型角色84<br />6.2.3 将过程分步拆解85<br />6.2.4 尽可能量化需求85<br />6.2.5 提供正反示例85<br />6.2.6 要求结构化输出86<br />6.2.7 合理进行限制86<br />6.2.8 使用链式思维87<br />6.3 使用提示词完成NLP任务88<br />6.3.1 使用提示词进行分词89<br />6.3.2 使用提示词提取关键词90<br />6.3.3 使用提示词进行文本分类90<br />6.3.4 使用提示词进行情感分析91<br />6.3.5 使用提示词进行文本摘要92<br />6.3.6 使用提示词进行中英文翻译93<br />6.4 小结93<br />第7章 Hugging Face入门与开发95<br />7.1 Hugging Face简介95<br />7.1.1 什么是Hugging Face95<br />7.1.2 Hugging Face Hub客户端库96<br />7.2 Hugging Face数据集工具99<br />7.2.1 数据集工具简介99<br />7.2.2 数据集工具的基本操作100<br />7.3 Hugging Face模型工具106<br />7.3.1 Transformers简介106<br />7.3.2 数据预处理112<br />7.3.3 模型微调114<br />7.3.4 模型评价指标118<br />7.4 小结120<br />第8章 LangChain入门与开发121<br />8.1 初识LangChain121<br />8.1.1 LangChain简介121<br />8.1.2 LangChain的开发生态122<br />8.2 模型I/O124<br />8.2.1 模型I/O简介124<br />8.2.2 提示词模板125<br />8.2.3 模型包装器128<br />8.2.4 输出解析器133<br />8.3 数据增强134<br />8.3.1 文档加载器135<br />8.3.2 文档转换器136<br />8.3.3 文本嵌入137<br />8.3.4 向量存储库138<br />8.3.5 检索器140<br />8.4 链141<br />8.5 小结142<br />第9章 大语言模型微调144<br />9.1 大语言模型微调概述144<br />9.1.1 为什么需要微调145<br />9.1.2 少样本提示与微调145<br />9.1.3 微调的基本流程146<br />9.2 大语言模型的微调策略147<br />9.2.1 全面微调147<br />9.2.2 参数高效微调148<br />9.3 基于ChatGPT的微调149<br />9.3.1 使用Fine-Tuning UI微调150<br />9.3.2 使用CLI命令微调151<br />9.3.3 使用API微调153<br />9.4 基于Hugging Face的开源大模型微调154<br />9.4.1 Accelerate介绍154<br />9.4.2 PEFT介绍159<br />9.5 小结160<br />第10章 大语言模型的部署161<br />10.1 MLOps与LLMOps161<br />10.1.1 DevOps简介161<br />10.1.2 MLOps简介162<br />10.1.3 LLMOps简介164<br />10.2 大语言模型量化部署164<br />10.2.1 Qwen2-0.5B简介165<br />10.2.2 ChatGLM3-6B简介165<br />10.2.3 基于Qwen2-0.5B的CPU推理166<br />10.2.4 基于ChatGLM3-6B的GPU量化推理167<br />10.3 大语言模型部署实战169<br />10.3.1 基于Gradio框架的网页部署169<br />10.3.2 基于FastAPI框架的接口部署171<br />10.4 小结173<br />第三篇 项目实战<br />第11章 数字人电商直播176<br />11.1 数字人直播概述176<br />11.1.1 数字人简介176<br />11.1.2 品牌虚拟代言人177<br />11.1.3 数字人与“人货场”178<br />11.2 2D数字人核心技术179<br />11.2.1 AI生成文案179<br />11.2.2 AI语音合成184<br />11.2.3 2D数字人口型驱动186<br />11.2.4 2D数字人直播推流187<br />11.3 2D数字人电商直播项目实战190<br />11.3.1 数字人直播流程简介190<br />11.3.2 大语言模型生成商品台词191<br />11.3.3 TTS将商品台词转成音频192<br />11.3.4 口型驱动生成2D数字人192<br />11.3.5 2D数字人推流到直播间194<br />11.4 小结196<br />第12章 数字人口播台词生成197<br />12.1 数字人口播台词生成概述197<br />12.1.1 数字人直播的台词特点197<br />12.1.2 数字人直播的台词编排200<br />12.1.3 数字人直播的防封策略201<br />12.2 数字人口播台词提示词模板203<br />12.2.1 整段式商品台词提示词模板203<br />12.2.2 分段式商品台词提示词模板204<br />12.2.3 商品互动问答台词提示词模板206<br />12.3 数字人口播台词生成项目实战208<br />12.3.1 使用提示词模板生成口播台词208<br />12.3.2 品牌知识库和提示词模板结合生成口播台词211<br />12.4 小结215<br />第13章 数字人直播间问答分类216<br />13.1 文本分类简介216<br />13.1.1 文本分类的方法216<br />13.1.2 文本分类的模型及特点218<br />13.1.3 文本分类的发展与挑战219<br />13.2 文本分类器的训练过程221<br />13.2.1 传统分类器的训练221<br />13.2.2 提示词少样本学习224<br />13.2.3 定制化微调预训练模型226<br />13.3 数字人直播间问答分类项目实战229<br />13.3.1 直播间问答分类简介229<br />13.3.2 直播间问答分类流程230<br />13.3.3 直播间问答分类实战231<br />13.4 小结234<br />第14章 数字人直播间互动问答235<br />14.1 RAG知识库构建235<br />14.1.1 RAG知识库基本概念235<br />14.1.2 RAG知识库构建流程236<br />14.1.3 RAG知识库的发展与挑战241<br />14.2 RAG知识库的优化策略243<br />14.2.1 非结构化文档解析优化243<br />14.2.2 文档分块策略优化243<br />14.2.3 中文Embedding优化246<br />14.2.4 Rewrite优化246<br />14.2.5 Rerank优化247<br />14.2.6 混合技术优化信息检索249<br />14.3 数字人直播间互动问答项目实战250<br />14.3.1 数字人直播间互动问答简介250<br />14.3.2 基于关键词检索的互动问答实现252<br />14.3.3 基于RAG向量库检索的互动问答实现254<br />14.3.4 基于RAG混合检索的互动问答实现255<br />14.3.5 基于大语言模型微调的互动问答实现257<br />14.4 小结257<br />第15章 数字人直播间数据分析Text2SQL258<br />15.1 数据分析的本质258<br />15.2 数据分析的思维和方法论259<br />15.2.1 费米估计259<br />15.2.2 辛普森悖论261<br />15.2.3 必知必会的两个原则262<br />15.2.4 三种思考模型263<br />15.2.5 四大战略分析工具265<br />15.2.6 五大生命周期理论266<br />15.2.7 数字化营销的“六脉神剑”270<br />15.3 数字人直播间数据分析Text2SQL项目实战273<br />15.3.1 Text2SQL概述273<br />15.3.2 Text2SQL开源项目简介276<br />15.3.3 Text2SQL项目实战277<br />15.4 小结283
基本信息 | |
---|---|
出版社 | 机械工业出版社 |
ISBN | 9787111785637 |
条码 | 9787111785637 |
编者 | 宿永杰 著 著 |
译者 | -- |
出版年月 | 2025-08-01 00:00:00.0 |
开本 | 16开 |
装帧 | 平装 |
页数 | 286 |
字数 | 420 |
版次 | 1 |
印次 | 1 |
纸张 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]