热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

数据科学导论

编号:
wx1204173329
销售价:
¥38.25
(市场价: ¥45.00)
赠送积分:
38
数量:
   
商品介绍

本书阐述了数据科学相关内容, 旨在帮助读者了解数据科学知识, 培养读者的数据科学意识。 全书共8章, 内容包括数据科学概述、 数据科学的数学基础、 Python语言基础、数据处理概述、数据科学的模型、大数据处理技术、数据可视化、 数据安全等。
通过学习, 读者能够了解数据科学涉及的相关知识, 并能运用相关工具来处理数据, 从而为后续的学习和研究奠定坚实的基础。
本书可作为高等院校数据科学导论课程的教材或教学参考书, 为教师的教学和学生的学习提供有力支持。同时, 对于那些在数据分析和软件编程领域已经积累了一定实际经验的人员, 本书也具有一定的参考价值。

第1章 数据科学概述 1
1.1 数据与大数据 1
1.1.1 数据 1
1.1.2 大数据 3
1.2 数据科学 5
1.2.1 数据科学的概念 5
1.2.2 数据科学的研究内容 5
1.2.3 数据科学与其他学科的联系 5
1.2.4 数据科学的应用 6
1.2.5 数据科学的发展方向 8
1.3 数据科学家 9
本章小结 10
习题1 10
第2章 数据科学的数学基础 11
2.1 线性代数 11
2.1.1 矩阵的基本概念 11
2.1.2 矩阵的运算 12
2.1.3 矩阵的初等变换 14
2.1.4 奇异值分解 15
2.2 图论基础 17
2.2.1 图论的基本概念 17
2.2.2 图的最短路径解决方案 19
2.2.3 深度优先搜索策略 21
2.3 微积分 21
2.3.1 导数与微分 21
2.3.2 矩阵求导 25
2.3.3 积分 26
2.4 概率与数理统计 28
2.4.1 随机事件的概率 28
2.4.2 随机变量及其数字特征 29
2.4.3 统计学 33
2.4.4 蒙特卡洛法 34
2.5 集合论 34
2.5.1 集合代数 34
2.5.2 二元关系 35
2.5.3 关系闭包 37
本章小结 37
习题2 37
第3章 Python语言基础 39
3.1 Python语言概述 39
3.1.1 Python简介 39
3.1.2 Python的发展历程 40
3.1.3 Python的安装与运行 40
3.1.4 编写Python程序 41
3.2 Python的编程基础 43
3.2.1 常量和变量 44
3.2.2 基本数据类型 46
3.2.3 注释 57
3.3 程序控制结构 57
3.3.1 选择结构 58
3.3.2 循环结构 61
3.4 函数与模块 63
3.4.1 函数 64
3.4.2 模块 67
本章小结 70
习题3 70
第4章 数据处理概述 71
4.1 数据采集 71
4.1.1 数据采集的概念与意义 71
4.1.2 数据采集的数据源 72
4.1.3 数据采集的方法 73
4.1.4 数据采集的流程 75
4.2 数据预处理 76
4.2.1 数据预处理的概念与意义 76
4.2.2 数据预处理的工具 77
4.2.3 数据预处理的流程 78
4.3 数据清洗 79
4.3.1 数据清洗的概念 79
4.3.2 数据异常的类型 79
4.3.3 数据清洗的方法 80
4.3.4 缺失数据处理 81
4.3.5 噪声数据处理 82
4.4 数据集成 83
4.4.1 数据集成的概念 83
4.4.2 实体识别处理 83
4.4.3 数据冲突处理 84
4.4.4 数据冗余处理 84
4.5 数据变换 85
4.5.1 数据变换的概念与主要策略 85
4.5.2 数据规范化 86
4.5.3 数据离散化 88
4.6 数据归约 89
4.6.1 数据归约的概念与作用 89
4.6.2 数据归约的策略 90
本章小结 92
习题4 93
第5章 数据科学的模型 94
5.1 机器学习初探 94
5.1.1 机器学习的概念及其核心要素 94
5.1.2 机器学习的发展历程 95
5.1.3 机器学习的基本术语 95
5.1.3 模型评估与性能度量 97
5.2 回归分析模型 100
5.2.1 线性回归模型 100
5.2.2 逻辑回归模型 102
5.2.3 回归模型的应用 104
5.3 分类模型 104
5.3.1 决策树 104
5.3.2 支持向量机 106
5.3.3 朴素贝叶斯 108
5.4 聚类模型 109
5.4.1 聚类概述 109
5.4.2 聚类方法 110
5.4.3 K-Means算法 112
5.5 神经网络模型 113
5.5.1 神经网络 113
5.5.2 深度学习 114
5.5.3 神经网络与深度学习的应用 116
5.6 集成学习 117
5.6.1 集成学习概述 117
5.6.2 序列化方法 118
5.6.3 并行化方法 119
本章小结 119
习题5 120
第6章 大数据处理技术 121
6.1 云计算 121
6.1.1 云计算的概念 121
6.1.2 云计算的服务类型 122
6.1.3 云计算的部署方式 123
6.1.4 云计算平台 125
6.1.5 虚拟化技术 126
6.2 Hadoop及其生态系统 127
6.2.1 Hadoop简介 127
6.2.2 Hadoop的特点 128
6.2.3 HDFS文件系统 129
6.2.4 YARN资源管理器 129
6.2.5 MapReduce计算模型 130
6.2.6 Hadoop生态系统 131
6.3 Spark及其生态系统 132
6.3.1 Spark简介 132
6.3.2 Spark的特点 132
6.3.3 Spark生态系统 133
6.3.4 RDD算子 134
6.4 应用案例 135
本章小结 146
习题6 146
第7章 数据可视化 148
7.1 数据可视化概述 148
7.1.1 数据可视化的概念 148
7.1.2 数据可视化的发展历程 148
7.1.3 数据可视化的作用 152
7.1.4 数据可视化的特征 152
7.2 数据可视化图表 154
7.2.1 数据可视化图表的组成元素 154
7.2.2 常见数据可视化图表类型 155
7.2.3 数据可视化图表的选择与设计原则 159
7.3 数据可视化工具 161
7.3.1 常用数据可视化工具 161
7.3.2 数据可视化工具选择技巧 166
7.4 数据可视化技术 167
7.4.1 数据可视化技术基础 167
7.4.2 数据可视化技术的应用 170
7.4.3 数据可视化技术的挑战 173
本章小结 174
习题7 175
第8章 数据安全 176
8.1 数据安全概述 176
8.1.1 传统数据安全 176
8.1.2 大数据安全 177
8.1.3 数据安全典型案例 179
8.2 大数据隐私 179
8.2.1 大数据隐私问题 180
8.2.2 数据与算法的透明性 180
8.2.3 大数据隐私保护政策 181
8.3 大数据安全和隐私保护相关技术 181
8.3.1 大数据安全相关技术 182
8.3.2 大数据隐私保护相关技术 186
8.4 数据备份 189
8.4.1 数据备份的概念 189
8.4.2 数据备份的功能 190
8.4.3 数据备份的方式 190
8.4.4 数据备份存在的挑战 191
8.5 数据容灾 192
8.5.1 数据容灾的概念 192
8.5.2 数据容灾的分类 192
8.5.3 数据容灾备份等级 194
本章小结 195
习题8 196
参考文献 197

商品参数
基本信息
出版社 西安电子科技大学出版社
ISBN 9787560676982
条码 9787560676982
编者 李旭 著
译者 --
出版年月 2025-08-01 00:00:00.0
开本 其他
装帧 平装
页数 208
字数 301
版次 1
印次
纸张 一般胶版纸
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]