热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

统计思维:用PYTHON学透探索性数据分析(原书第3版)

编号:
wx1204437914
销售价:
¥87.10
(市场价: ¥99.00)
赠送积分:
87
数量:
   
商品介绍

作者背景资深:Allen B. Downey是欧林工程学院计算机科学教授,曾任教于韦尔斯利学院、科尔比学院与加州大学伯克利分校,拥有加州大学伯克利分校计算机科学博士学位及麻省理工学院学士硕士学位,O'Reilly Think系列著作作者。
程序员视角创新教学:打破传统统计学晦涩数学授课模式,以Python编程为载体,用计算思维重构统计学学习路径,完美契合程序员认知习惯。
内容体系完整:从数据导入与清洗的基础步骤,到单变量、双变量的探索性分析,再到多重回归、时间序列分析、生存分析等高级主题,层层递进、环环相扣。
真实数据驱动:使用NSFG等真实公开数据集进行完整分析演示,让抽象统计概念变得可感可知,培养读者解决实际问题的能力。
交互式学习体验:全面迁移至Jupyter Notebook环境,读者无须复杂配置即可通过Google Colab直接运行所有代码,实现阅读、编码、练习一体化学习。
从入门到进阶全覆盖:基础篇夯实统计思维根基,高级篇满足专项学习需求,无论零基础入门还是进阶提升,一书搞定。
配套资源丰富:所有代码可在Google Colab一键运行,每章配有练习题与实战案例,搭建标准化、可复现的数据分析流程。

本书是面向零基础读者的Python探索性数据分析与统计学入门实战读物,秉持“统计是实用数据工具”的核心理念,区别于传统数理统计的理论教学模式,聚焦实操落地,适配具备基础Python能力、无深厚数学与统计功底的学习者。全书严格贴合真实数据分析工作流程,层层递进拆解核心技能,内容分为三大模块:基础模块讲解数据导入清洗、数据分布表征、各类经典统计分布建模方法,依托NumPy、Pandas、empiricaldist库实现基础数据处理与可视化;进阶模块聚焦变量关联挖掘,详解相关性分析、最小二乘拟合、多重回归、逻辑回归等核心技法,助力读者搭建数据预测模型;高阶模块覆盖时间序列分析、生存分析、中心极限定理、假设检验等专业内容,完善数据分析全栈能力体系。全书所有案例与练习均采用多领域真实公开数据集,贴合实际业务场景。第3版完成全面迭代,整体迁移至Jupyter Notebook环境,简化代码逻辑、优化工具应用、更新习题体系,支持在线交互式运行,读者可通过实操模拟直观理解抽象统计概念,规避理论学习误区,高效掌握可落地的统计分析技能,轻松实现从理论认知到实战数据分析的进阶。

Allen B. Downey现任奥林工程学院计算机科学教授,曾先后任教于韦尔斯利学院、科尔比学院与加州大学伯克利分校。他拥有加州大学伯克利分校计算机科学博士学位,以及麻省理工学院硕士与学士学位。著有Think Python、Think Bayes、Think DSP等经典作品,同时运营个人博客Probably Overthinking It。

目录
前言1
第1章 探索性数据分析7
1.1 证据7
1.2 NSFG8
1.3 读取数据9
1.4 数据验证12
1.5 数据转换15
1.6 汇总统计量16
1.7 解读17
1.8 术语表18
1.9 练习题19
第2章 分布21
2.1频率表21
2.2 NSFG数据的分布23
2.3 异常值26
2.4 头胎婴儿28
2.5 效应量29
2.6 结果的呈现31
2.7 术语表31
2.8 练习题32
第3章 概率质量函数34
3.1 概率质量函数概述34
3.2 汇总概率质量函数37
3.3 班级规模悖论39
3.4 NSFG数据42
3.5 其他可视化方法43
3.6 术语表44
3.7 练习题44
第4章 累积分布函数47
4.1 百分位数和百分位等级47
4.2 累积分布函数概述50
4.3 比较累积分布函数53
4.4 基于百分位数的统计量55
4.5 随机数59
4.6 术语表61
4.7 练习题62
第5章 建模分布64
5.1 二项分布64
5.2 泊松分布69
5.3 指数分布72
5.4 正态分布75
5.5 对数正态分布78
5.6 为什么要建模81
5.7 术语表82
5.8 练习题82
第6章 概率密度函数84
6.1 比较分布84
6.2 概率密度87
6.3 指数概率密度函数90
6.4 概率质量函数与概率密度函数的比较92
6.5 核密度估计93
6.6 分布框架97
6.7 术语表101
6.8 练习题102
第7章 变量间的关系104
7.1 散点图104
7.2 十分位数图108
7.3 相关性110
7.4 相关强度114
7.5 等级相关115
7.6 相关性与因果关系118
7.7 术语表119
7.8 练习题120
第8章 估计123
8.1 称量企鹅123
8.2 稳健性127
8.3 估计方差129
8.4 抽样分布130
8.5 标准误差132
8.6 置信区间133
8.7 误差来源134
8.8 术语表134
8.9 练习题136
第9章 假设检验140
9.1 抛硬币140
9.2 检验均值差异143
9.3 其他检验统计量145
9.4 检验相关性147
9.5 比例检验149
9.6 术语表152
9.7 练习题153
第10章 最小二乘法155
10.1 最小二乘拟合155
10.2 决定系数159
10.3 最小化均方误差161
10.4 估计162
10.5 不确定性的可视化164
10.6 变量变换165
10.7 术语表170
10.8 练习题171
第11章 多重回归173
11.1 StatsModels程序包173
11.2 多重回归模型176
11.3 控制变量178
11.4 非线性关系182
11.5 逻辑回归184
11.6 术语表188
11.7 练习题189
第12章 时间序列分析191
12.1 电力191
12.2 分解192
12.3 预测198
12.4 乘法模型201
12.5 自回归205
12.6 移动平均208
12.7 使用自回归模型进行回顾预测209
12.8 ARIMA模型211
12.9 用ARIMA模型进行预测213
12.10 术语表214
12.11 练习题215
第13章 生存分析218
13.1 生存函数218
13.2 风险函数220
13.3 婚姻数据222
13.4 加权自助法225
13.5 估计风险函数226
13.6 估计生存函数229
13.7 lifelines程序包231
13.8 置信区间232
13.9 期望剩余寿命234
13.10 术语表237
13.11 练习题238
第14章 解析方法241
14.1 正态概率图241
14.2 正态分布245
14.3 样本均值的分布248
14.4 差值分布250
14.5 中心极限定理252
14.6 中心极限定理的局限性254
14.7 应用中心极限定理255
14.8 相关性检验258
14.9 卡方检验262
14.10 计算方法与解析方法264
14.11 术语表265
14.12 练习题266

商品参数
基本信息
出版社 机械工业出版社
ISBN 9787111810254
条码 9787111810254
编者 [美]艾伦·B.唐尼(Allen B.Downey) 著 范秉理 刘玉婷 译
译者 范秉理,刘玉婷
出版年月 2026-06-01 00:00:00.0
开本 16开
装帧 平装
页数 268
字数 357
版次 1
印次 1
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]