热门搜索: 中考 高考 考试 开卷17
服务电话 024-96192/23945006
 

白话机器学习算法

编号:
wx1201843345
销售价:
¥42.14
(市场价: ¥49.00)
赠送积分:
42
数量:
   
商品介绍

斯坦福大学大数据基础课程教材
文科生也看得懂的算法及数据科学入门书
涵盖回归分析、神经网络、决策树、A/B测试等重要主题

与使用数学语言或计算机编程语言讲解算法的书不同,本书另辟蹊径,用通俗易懂的人类语言以及大量有趣的示例和插图讲解10多种前沿的机器学习算法。内容涵盖k均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法,以及回归分析、k很近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法,并概述强化学习算法的思想。

黄莉婷(Annalyn Ng),不错数据分析师,剑桥大学心理测量中心硕士,曾受邀在迪士尼研究中心研究客户行为科学,并通过数据挖掘技术帮助三星和雅虎等公司制定营销和人员招聘等方面的策略。

苏川集(Kenneth Soo),斯坦福大学统计学硕士,华威大学高材生,曾从事网络随机故障下应用程序的双目标稳健优化研究,善于用通俗的语言介绍数据科学。

第 1章 基础知识 1
1.1  准备数据  1
1.1.1  数据格式  1
1.1.2  变量类型  2
1.1.3  变量选择  3
1.1.4  特征工程  3
1.1.5  缺失数据  4
1.2  选择算法  4
1.2.1  无监督学习  5
1.2.2  监督学习  6
1.2.3  强化学习  7
1.2.4  注意事项  7
1.3  参数调优  7
1.4  评价模型  9
1.4.1  分类指标  9
1.4.2  回归指标  10
1.4.3  验证  10
1.5  小结  11
第  2章 k均值聚类  13
2.1  找出顾客群  13
2.2  示例:影迷的性格特征  13
2.3  定义群组  16
2.3.1  有多少个群组  16
2.3.2  每个群组中有谁  17
2.4  局限性  18
2.5  小结  19
第3章  主成分分析  21
3.1  食物的营养成分  21
3.2  主成分  22
3.3  示例:分析食物种类  24
3.4  局限性  27
3.5  小结  29
第4章  关联规则  31
4.1  发现购买模式  31
4.2  支持度、置信度和提升度  31
4.3  示例:分析杂货店的销售数据  33
4.4  先验原则  35
4.4.1  寻找具有高支持度的项集  36
4.4.2  寻找具有高置信度或高提升度的关联规则  37
4.5  局限性  37
4.6  小结  37
第5章  社会网络分析  39
5.1  展现人际关系  39
5.2  示例:国际贸易  40
5.3  Louvain方法  42
5.4  PageRank算法  43
5.5  局限性  46
5.6  小结  47
第6章  回归分析  49
6.1  趋势线  49
6.2  示例:预测房价  49
6.3  梯度下降法  52
6.4  回归系数  54
6.5  相关系数  55
6.6  局限性  56
6.7  小结  57
第7章  k最近邻算法和异常检测  59
7.1  食品检测  59
7.2  物以类聚,人以群分  60
7.3  示例:区分红白葡萄酒  61
7.4  异常检测  62
7.5  局限性  63
7.6  小结  63
第8章  支持向量机  65
8.1  医学诊断  65
8.2  示例:预测心脏病  65
8.3  勾画最佳分界线  66
8.4  局限性  69
8.5  小结  69
第9章  决策树  71
9.1  预测灾难幸存者  71
9.2  示例:逃离泰坦尼克号  72
9.3  生成决策树  73
9.4  局限性  74
9.5  小结  75
第  10章 随机森林  77
10.1  集体智慧  77
10.2  示例:预测犯罪行为  77
10.3  集成模型  81
10.4  自助聚集法  82
10.5  局限性  83
10.6  小结  84
第  11章 神经网络  85
11.1  建造人工智能大脑  85
11.2  示例:识别手写数字  86
11.3  神经网络的构成  89
11.4  激活规则  91
11.5  局限性  92
11.6  小结  94
第  12章 A/B测试和多臂老虎机  95
12.1  初识A/B测试  95
12.2  A/B测试的局限性  95
12.3  epsilon递减策略  96
12.4  示例:多臂老虎机  97
12.5  胜者为先  99
12.6  epsilon递减策略的局限性  99
12.7  小结  100
附录A  无监督学习算法概览  101
附录B  监督学习算法概览  102
附录C  调节参数列表  103
附录D  更多评价指标  104
术语表  107
关于作者  114

"这本书出色地将机器学习概念可视化,有利于非技术专业的学生直观理解这些抽象概念。"
--Ethan Chan 斯坦福大学大数据讲师

"这是一本通俗易懂的机器学习算法书。数据科学新手可以将它作为入门读物;商务人士可以通过它理解数据分析师的工作;任何想了解自己的个人数据何去何从的读者,都会从中有所启发。"
--David Stillwell 剑桥大学心理测量中心副主任

"对于和大数据打交道的商务人士来说,这本书有助于解开他们对不错统计学的疑惑。"
--Tathagata Dasgupta 维亚康姆集团数据科学与不错分析部主管

"我向所有想汲取数据科学和机器学习的精髓却不想陷入数学和编程细节的人推荐这本书。"
--亚马逊读者

商品参数
基本信息
出版社 人民邮电出版社
ISBN 9787115506641
条码 9787115506641
编者 [新加坡] 黄莉婷 苏川集
译者 武传海
出版年月 2018-10-01 00:00:00.0
开本 其他
装帧 平装
页数 113
字数 139000.000
版次 1
印次
纸张
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]