暂无商品咨询信息 [发表商品咨询]
在数据驱动决策成为主流的当下,无论是想入行数据科学的 “萌新”,还是渴望提升技能的从业者,都急需一本系统全面的实战指南。《数据驱动:机器学习实战之道》正是这样一本佳作,它将带领你开启数据科学的进阶之旅。
本书的亮点在于其系统性与实战性的完美结合。全书围绕数据科学全流程展开,从数据科学技术基础概念引入,到数据可视化、任务完整流程,再深入机器学习流程五大阶段详解,内容环环相扣。每一个知识点都搭配了详尽的理论讲解与 Python 3.9.20 代码实例,让读者能够边学边练,真正将知识转化为解决实际问题的能力。例如,在数据可视化章节,书中不仅介绍了基础图、多图组合、三维图、动态图等多种可视化技术,还对常用的可视化库进行了细致对比,读者可以根据实际需求快速选择合适的工具,将枯燥的数据转化为直观易懂的图表。
在技术介绍方面,本书同样表现出色。对于 CRISP-DM 和 TDSP 等常见的数据科学生命周期模型,书中不仅进行了详细介绍,还深入对比了它们的优缺点,为读者在实际项目规划中提供了有力参考。在机器学习流程讲解中,从初步探索性数据分析、数据工程,到模型训练、评估与推理,再到模型发布、部署与监控,每一个环节都剖析得十分透彻。以数据工程为例,对数据清洗中缺失值、异常值处理,以及特征工程中特征构造、特征三化等技术细节的讲解,能够帮助读者有效提升模型性能。
当模型项目进入收尾阶段,《数据驱动:机器学习实战之道》也没有止步。第 8 章专门针对模型项目进行整体性分析、反思与优化,无论是模型过拟合 / 欠拟合问题,还是数据层面、算法层面、系统层面以及代码层面的优化,书中都给出了实用的解决方案和代码实战示例,助力读者打造出更高效、更优质的模型项目。
无论你是想要转行数据科学的职场人士,渴望在新领域一展身手;还是对数据科学充满好奇的学生和爱好者,希望深入探索这个充满魅力的领域,《数据驱动:机器学习实战之道》都能成为你坚实的学习伙伴。
本书旨在帮助读者从零开始,系统掌握数据科学核心技术,并通过实战案例深化理解。本书共分为8章,包括数据科学技术简介,数据可视化技术,数据科学任务完整流程,初步探索性数据分析(EDA),数据工程(数据分析+数据处理),模型训练、评估与推理,模型发布、部署与监控,模型项目整体性分析、反思与优化,同时涵盖了数据采集、处理、可视化、建模及评估的全流程,配备详尽理论讲解与代码示例,助力读者在数据驱动的世界中游刃有余,解决实际问题,实现数据价值优化。本书相关代码可扫描封底二维码获得。
无论是想要转行数据科学的职场人士,还是对数据科学充满好奇的学生和爱好者,这本书都将是宝贵资源。
前言
第1部分 数据科学技术实战
第1章 数据科学技术简介/
1.1数据科学技术概述/
1.2数据科学生命周期简介/
1.2.1数据科学生命周期概述/
1.2.2CRISP-DM模型简介/
1.2.3TDSP模型简介/
1.2.4五大模型对比与总结/
第2章 数据可视化技术/
2.1基础图简介及代码实现/
2.1.1单维度可视化/
2.1.2多维度可视化/
2.1.3其他图的简介/
2.2多图组合的简介及代码实现/
2.2.1单关系图(Jointplot/JointGrid函数)/
2.2.2多变量关系矩阵图(pairplot/PairGrid函数)/
2.2.3数据分组矩阵图(FacetGrid函数)/
2.3三维图简介及其代码实现/
2.3.1三维散点图、三维柱状图、三维折线图/
2.3.2三维标签图——八象空间三维图/
2.4动态图简介及其代码实现/
2.4.1动态趋势图/
2.4.2动态轨迹图/
2.5常用的图可视化相关库/
2.5.1常用库的概述/
2.5.2不同库的对比/
第3章 数据科学任务完整流程/
3.1数据科学任务流程概述/
3.2问题定义/
3.3数据认知/
3.3.1数据认知概述/
3.3.2数据收集/
3.3.3数据渠道/
3.3.4数据存储/
3.3.5数据采样/
3.3.6数据不均衡/
3.3.7特征初筛/
3.4机器学习核心流程/
3.5决策支持/
第2部分机器学习流程五大阶段详解
第4章 初步探索性数据分析(EDA)/
4.1EDA概述/
4.2载入数据/
4.2.1载入数据概述/
4.2.2载入数据代码实战/
4.3初步概览数据集信息/
4.3.1初步概览数据集信息概述/
4.3.2初步概览数据集信息代码实战/
4.4划分特征类型/
4.4.1相关术语解释/
4.4.2四大特征类型概述/
4.4.3划分特征类型代码实战/
4.5分离特征与标签/
4.5.1分离特征与标签概述/
4.5.2分离特征与标签代码实战/
第5章 数据工程(数据分析+数据处理)/
5.1数据工程概述/
5.2数据清洗/
5.2.1数据对齐——针对原生“类别型”特征/
5.2.2缺失值的分析与处理/
5.2.3异常值的分析与处理/
5.2.4特殊值的分析与处理/
5.3数据分析与处理/
5.3.1数据分析与处理概述/
5.3.2校验两份数据集是否同分布/
5.3.3目标变量的分析与处理/
5.3.4“类别型”特征分析与处理/
5.3.5“数值型”特征分析与处理/
5.3.6组合关联统计分析/
5.4构造特征/
5.4.1基于常识经验和领域知识构造特征/
5.4.2基于纯技术构造特征/
5.4.3基于业务规则和意义构造特征/
5.4.4利用深度学习技术自动构造特征/
5.4.5相关库和框架/
5.5特征三化/
5.5.1特征三化概述/
5.5.2“数值型”特征归一化/
5.5.3“类别型”特征编码化/
5.5.4特征向量化/
5.6优化特征集/
5.6.1优化特征集概述/
5.6.2特征删除/
5.6.3特征筛选/
5.6.4特征降维(狭义)/
5.7特征导出(可选)/
第6章 模型训练、评估与推理/
6.1模型训练、评估与推理概述/
6.2数据集划分/
6.3模型选择与训练/
6.3.1选择算法/
6.3.2模型训练/
6.4模型评估与调优/
6.4.1模型评估/
6.4.2模型调优/
6.5模型预测结果剖析/
6.5.1Bad-case分析/
6.5.2特征重要性挖掘/
6.6模型可解释性分析/
6.6.1模型可解释相关图的简介/
6.6.2模型可解释性分析代码实战/
6.7模型导出并推理/
6.7.1模型导出/
6.7.2模型推理(基于无标签的新数据)/
6.7.3模型导出并推理代码实战/
第7章 模型发布、部署与监控/
7.1模型发布、部署与监控概述/
7.2模型发布/
7.2.1模型发布概述/
7.2.2模型发布代码实战/
7.3模型部署/
7.3.1模型部署概述/
7.3.2模型部署的实现/
7.3.3模型部署的流程/
7.3.4模型部署代码实战/
7.4模型监控/
7.4.1模型监控概述/
7.4.2模型监控常用工具/
7.4.3模型监控代码实战/
第8章 模型项目整体性分析、反思与优化/
8.1模型项目整体性分析、反思与优化概述/
8.2模型过拟合/欠拟合问题/
8.2.1模型过拟合/欠拟合问题概述/
8.2.2L1正则化和L2正则化对比/
8.2.3模型过拟合/欠拟合问题代码实战/
8.3数据层面优化/
8.3.1数据层面优化概述/
8.3.2数据增强/
8.3.3数据稀疏及其优化/
8.3.4数据泄露及其优化/
8.3.5数据降内存/
8.4算法层面优化/
8.4.1算法层面优化概述/
8.4.2单算法优化/
8.4.3多算法模型融合——模型提效技巧点/
8.5系统优化/
8.5.1系统优化概述/
8.5.2系统优化的常用思路和方法/
8.5.3机器学习系统架构设计简介/
8.6代码优化/
8.6.1代码优化概述/
8.6.2代码优化代码实战/
基本信息 | |
---|---|
出版社 | 机械工业出版社 |
ISBN | 9787111779308 |
条码 | 9787111779308 |
编者 | 牛亚运 著 |
译者 | -- |
出版年月 | 2025-05-01 00:00:00.0 |
开本 | 16开 |
装帧 | 平装 |
页数 | 388 |
字数 | 627 |
版次 | 1 |
印次 | 1 |
纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]