热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

PYTHON机器学习工程实战(第2版)

编号:
wx1203612885
销售价:
¥172.26
(市场价: ¥198.00)
赠送积分:
172
数量:
   
商品介绍

本书是一本面向机器学习实务的专业指南,通过系统化的工程学视角帮助读者将机器学习理论转化为实际应用。全书共九章。内容从基础知识到模型标准化、部署模式、扩展规模及深度学习应用,层层深入,逐步构建机器学习工程的完整知识体系。书中特别强调如何在Python中高效编码与设计,如何在大规模数据集上开发,以及当下热门的大型语言模型(LLM)构建与运营方法。本书不仅传播技术,更传递了工程学的严谨与实践精神,旨在培养能够解决复杂技术问题并引领数据科学发展的专业人才。无论是初学者,还是行业从业者,本书对读者来说都是一次深入机器学习工程的宝贵探索。

第1章 机器学习工程简介 1
技术要求 2
定义数据学科的分类 4
数据科学家 4
机器学习工程师 5
机器学习运维工程师 6
数据工程师 8
作为一个高效的团队进行协作 8
在现实世界中的机器学习工程 9
什么是机器学习解决方案? 12
为什么使用Python? 14
机器学习系统的高层设计 14
示例1:批量异常检测服务 15
示例2:预测API 21
示例3:分类流程 26
本章小结 30
第2章 机器学习开发流程 32
技术要求 33
配置我们的工具 34
设置AWS账户 38
从概念到解决方案的四个步骤 39
将这与CRISP-DM进行比较 41
发现 42
使用用户故事 43
运行 45
开发 46
部署 63
了解你的部署选项 63
理解DevOps和MLOps 65
使用GitHub Actions构建第一个CI/CD示例 68
持续模型性能测试 72
持续模型训练 74
本章小结 76
第3章 从模型到模型工厂 78
技术要求 79
定义模型工厂 80
掌握学习的方法 81
定义目标 81
减小损失 82
准备数据 83
为机器学习设计特征工程 84
设计分类特征工程 84
设计数值特征工程 86
设计训练系统 89
训练-系统设计选项 90
训练-运行模式 91
训练-持久化 92
模型重训练 93
检测数据漂移 95
检测概念漂移 98
设置限制 100
诊断漂移 101
修正数据漂移 103
其他监控工具 105
自动训练 109
自动化的层次结构 109
优化超参数 111
AutoML 118
持久化你的模型 121
构建模型工厂与管道 125
Scikit-learn管道 126
Spark ML管道 130
本章小结 133
第4章 打包封装 135
技术要求 136
编写优秀的Python代码 136
回顾基础知识 137
诀窍与技巧 139
坚持标准 142
编写高质量的PySpark代码 144
选择风格 145
面向对象编程 145
函数式编程 148
打包你的代码 150
为什么要打包? 151
选择打包的用例 152
设计你的包 153
构建你自己的包 158
使用Makefile管理你的环境 160
使用Poetry进行打包 165
测试、日志记录、安全性和错误处理 170
测试 170
保护你的解决方案 174
分析自己的代码以发现安全问题 175
分析依赖项以发现安全问题 177
记录日志 180
错误处理 183
不要重复发明轮子 191
本章小结 191
第5章 部署模式和工具 193
技术要求 194
设计系统 194
基于原则构建 196
探索一些标准的机器学习模式 199
在数据湖中畅游 199
微服务 200
基于事件的设计 202
批处理 203
容器化 204
在AWS上托管你自己的微服务 208
推送到ECR 209
在ECS上托管 211
使用Airflow构建通用管道 224
Airflow 224
构建高级机器学习管道 237
使用ZenML 237
使用Kubeflow 249
选择你的部署策略 259
本章小结 260
第6章 扩展规模 262
技术要求 263
使用Spark进行扩展 263
Spark技巧和窍门 265
云上的Spark 273
启动无服务器基础设施 283
使用Kubernetes实现大规模容器化 292
使用Ray进行扩展 294
开始使用Ray进行机器学习 298
设计大规模系统 305
本章小结 308
第7章 深度学习、生成人工智能和LLMOps 310
深入探讨深度学习 311
使用PyTorch 314
将深度学习扩展并投入生产实践 318
微调和迁移学习 322
使用LLM 331
理解LLM 332
通过API使用LLM 333
使用LLM进行编码 336
利用LLM构建未来 340
LLM验证 341
PromptOps 343
本章小结 344
第8章 构建ML微服务 345
技术要求 345
理解预测问题 346
设计我们的预测服务 348
选择工具 350
规模化训练 352
使用FastAPI提供模型服务 356
响应和请求模式 359
在微服务中管理模型 363
将所有内容整合在一起 366
容器化并部署到Kubernetes 371
将应用程序容器化 372
使用Kubernetes进行扩展 373
部署策略 376
本章小结 377
第9章 构建一个提取、转换、机器学习用例 379
技术要求 380
理解批处理问题 382
设计ETML解决方案 384
工具选择 386
接口和存储 386
模型的扩展 387
ETML管道的调度 388
执行构建 389
使用高级Airflow功能构建ETML管道 390
本章小结 403

商品参数
基本信息
出版社 电子工业出版社
ISBN 9787121500169
条码 9787121500169
编者 (美)AndrewMcmahon(彼得·麦克马洪) 著 殷海英 等 译
译者
出版年月 2025-04-01 00:00:00.0
开本 其他
装帧 平装
页数 428
字数
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]