热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

R数据科学(第2版)

编号:
wx1204055158
销售价:
¥137.43
(市场价: ¥159.80)
赠送积分:
137
数量:
   
商品介绍


本书是数据科学与数据分析领域经典作品,由R社区领军人物Hadley Wickham领衔打造。第2版全面更新,结合tidyverse及RStudio,通过实战示例和练习,帮助读者快速掌握数据处理、可视化与编程等核心数据科学技能。全书分为六大部分——全流程、可视化、变换、导入、编程与交流——完整覆盖数据科学全流程。

本书适合统计、数据科学和机器学专业的学生,以及数据分析师、数据科学家及其他有数据处理与可视化需求的读者。

张敬信,哈尔滨工业大学基础数学博士,现任哈尔滨商业大学数学与应用数学系主任、副教授。长期深耕数学建模与数据科学的教学与研究,致力于R语言生态系统的推广与应用。著有《R语言编程:基于tidyverse》《R机器学习:基于mlr3verse》。

王小宁,中国传媒大学副教授,知名数据科学社区“统计之都”秘书长。致力于推广统计学方法在工作和日常生活中的应用。译有《R语言实战(第2版)》《ggplot2:数据分析与图形艺术(第2版)》。

黄俊文,毕业于中山大学和加州大学圣地亚哥分校,现任某互联网大厂数据科学家。长期从事数据分析工作,熟练使用R、Python、SQL,对数据背后的真相充满好奇。

译者序 xix

引言 xxi

第一部分 全流程

第1章 数据可视化 3

1.1 引言 3

1.2 起步阶段 4

1.2.1 penguins数据框 4

1.2.2 终极目标 6

1.2.3 创建ggplot图形 6

1.2.4 添加美学和图层 9

1.2.5 练习题 13

1.3 ggplot2调用 15

1.4 可视化分布 15

1.4.1 分类变量 15

1.4.2 数值变量 17

1.4.3 练习题 18

1.5 可视化关系 19

1.5.1 数值变量与分类变量 19

1.5.2 两个分类变量 21

1.5.3 两个数值变量 23

1.5.4 三个及三个以上变量 23

1.5.5 练习题 24

1.6 保存图形 25

1.7 常见问题 26

1.8 小结 26

第2章 工作流:基础 27

2.1 编程基础 27

2.2 注释 28

2.3 命名对象 29

2.4 调用函数 29

2.5 练习题 30

2.6 小结 31

第3章 数据变换 32

3.1 引言 32

3.1.1 准备工作 32

3.1.2 nycflights13 33

3.1.3 dplyr基础 34

3.2 操作行 34

3.2.1 filter() 35

3.2.2 常见错误 36

3.2.3 arrange() 37

3.2.4 distinct() 37

3.2.5 练习题 39

3.3 操作列 39

3.3.1 mutate() 39

3.3.2 select() 41

3.3.3 rename() 42

3.3.4 relocate() 42

3.3.5 练习题 43

3.4 管道 43

3.5 分组 45

3.5.1 group_by() 45

3.5.2 summarize() 46

3.5.3 slice_*函数 47

3.5.4 根据多个变量分组 48

3.5.5 解除分组 48

3.5.6 .by参数 49

3.5.7 练习题 50

3.6 案例研究:聚合与样本量 51

3.7 小结 53

第4章 工作流:代码风格 54

4.1 命名 55

4.2 空格 55

4.3 管道 56

4.4 ggplot2 57

4.5 分节注释 58

4.6 练习题 58

4.7 小结 59

第5章 数据整理 60

5.1 引言 60

5.2 整洁数据 61

5.3 转换为长数据 63

5.3.1 列名中包含变量值 64

5.3.2 转换为长数据是如何实现的 67

5.3.3 列名中包含多个变量值 68

5.3.4 列名中包含变量值和变量名 70

5.4 转换为宽数据 71

5.5 小结 75

第6章 工作流:脚本和项目 76

6.1 脚本 76

6.1.1 运行代码 77

6.1.2 RStudio诊断 78

6.1.3 保存与命名 78

6.2 项目 79

6.2.1 分析的真实源头是什么 80

6.2.2 如何存放分析项目 81

6.2.3 RStudio项目 81

6.2.4 相对路径与绝对路径 83

6.3 练习题 83

6.4 小结 84

第7章 数据导入 85

7.1 引言 85

7.2 从文件中读取数据 85

7.2.1 实用建议 86

7.2.2 其他参数 88

7.2.3 其他文件类型 90

7.2.4 练习题 90

7.3 控制列类型 91

7.3.1 猜测类型 91

7.3.2 缺失值、列类型与问题 92

7.3.3 列类型 93

7.4 从多个文件中读取数据 94

……

商品参数
基本信息
出版社 人民邮电出版社
ISBN 9787115682642
条码 9787115682642
编者 (新西兰)哈德利·威克姆(Hadley Wickham),(美)米内·切廷卡亚-郎德尔(Mine Cetinkaya-Rundel),(美)加勒特·格罗勒芒德(Garrett Grolemund) 著 张敬信,王小宁,黄俊文 译 译
译者
出版年月 2025-12-01 00:00:00.0
开本 16开
装帧 平装
页数 471
字数 806000
版次 2
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]