程序员必会的50种算法（原书第2版）

编号:: wx1203724734

销售价:: ￥100.62; (市场价: ~~￥129.00~~)

赠送积分:: 101

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

本书内容丰富，涉及算法基础、设计技术、分析方法、排序算法、搜索算法、图算法、机器学习算法（含无监督/监督学习算法、神经网络算法、自然语言处理算法以及LLM相关算法）、推荐引擎、密码算法、大规模算法等内容，新增GAN、Transformer 等生成模型与现代序列模型内容，以Python为工具，详解算法实现、性能对比与实战技巧，搭配欺诈检测、天气预测等真实案例，助力程序员快速掌握解决问题的算法思维。

本书是算法学习的宝典，为解决实际编程难题提供了强大工具。书中精心挑选50种在软件开发中极为重要的算法，对每种算法与示例都进行了详尽解释，涵盖数据结构操作、搜索策略、排序方法、图形处理技术等。相比第1版，新版内容更丰富，范围更广泛，更新了部分过时信息，增加了如机器学习中的算法优化技巧、大数据处理方法，以及现代顺序模型及其变体、实现大语言模型（LLM）的算法、方法和架构等新兴领域算法。每一章都遵循相同结构：先介绍算法基本概念与适用场景，接着通过代码展示工作原理，最后进行实际案例分析，助力读者将知识转化为实践技能。此外，本书注重培养算法思维，剖析算法背后的逻辑推理过程，可帮助读者学会设计有效算法，在不断变化的技术环境中保持竞争力，是程序员提升自我的宝藏资源。

目　　录　Contents 序 前言 作者简介 审校者简介 第一部分　基础算法和核心算法 第1章　算法概述2 1.1　什么是算法3 1.1.1　算法的各个阶段3 1.1.2　开发环境4 1.2　Python包5 1.3　算法设计技巧7 1.3.1　数据维度7 1.3.2　计算维度9 1.4　性能分析9 1.4.1　空间复杂度分析9 1.4.2　时间复杂度分析11 1.4.3　性能评估12 1.4.4　大O记号12 1.4.5　常数时间复杂度14 1.4.6　线性时间复杂度15 1.4.7　平方时间复杂度15 1.4.8　对数时间复杂度16 1.5　选择算法17 1.6　验证算法17 1.6.1　精确算法、近似算法和随机 算法17 1.6.2　可解释性18 1.7　小结19 第2章　算法中的数据结构20 2.1　探讨Python中的数据结构20 2.1.1　列表21 2.1.2　元组25 2.1.3　字典和集合26 2.1.4　使用序列和数据帧30 2.1.5　矩阵33 2.2　探索抽象数据类型34 2.2.1　向量34 2.2.2　栈35 2.2.3　队列37 2.2.4　树39 2.3　小结42 第3章　排序算法和搜索算法43 3.1　排序算法简介43 3.1.1　在Python中交换变量44 3.1.2　冒泡排序44 3.1.3　插入排序47 3.1.4　归并排序49 3.1.5　希尔排序52 3.1.6　选择排序53 3.1.7　选择一种排序算法54 3.2　搜索算法简介55 3.2.1　线性搜索56 3.2.2　二分搜索56 3.2.3　插值搜索57 3.3　实际应用58 3.4　小结60 第4章　算法设计61 4.1　算法设计基本概念简介61 4.1.1　正确性：所设计的算法是否会 产生我们期望的结果62 4.1.2　性能：所设计算法是获取结果的 最佳方法吗63 4.1.3　可扩展性：所设计算法在更大的 数据集上表现得怎么样67 4.2　理解算法策略67 4.2.1　理解分治策略68 4.2.2　理解动态规划策略70 4.2.3　理解贪婪算法71 4.3　实际应用—求解TSP72 4.3.1　使用蛮力策略73 4.3.2　使用贪婪算法76 4.3.3　两种策略比较77 4.4　PageRank算法77 4.4.1　问题定义77 4.4.2　实现PageRank算法78 4.5　理解线性规划80 4.5.1　线性规划问题的形式化描述81 4.5.2　实际应用—用线性规划实现 产量规划81 4.6　小结83 第5章　图算法84 5.1　理解图：简要介绍85 5.1.1　图：现代数据网络的支柱85 5.1.2　图的基础：顶点（或节点）86 5.2　图论与网络分析87 5.3　图的表示87 5.4　图的机制和类型87 5.5　网络分析理论简介89 5.5.1　理解最短路径90 5.5.2　理解中心性度量92 5.5.3　用Python计算中心性指标94 5.5.4　社交网络分析97 5.6　理解图的遍历97 5.6.1　广度优先搜索97 5.6.2　深度优先搜索101 5.7　案例研究：使用SNA进行欺诈 检测103 5.7.1　介绍103 5.7.2　在这种情况下，什么是欺诈103 5.7.3　进行简单的欺诈分析105 5.7.4　瞭望塔欺诈分析法106 5.8　小结108 第二部分　机器学习算法 第6章　无监督机器学习算法110 6.1　无监督学习简介110 6.1.1　数据挖掘生命周期中的无监督 学习111 6.1.2　无监督学习的当前研究趋势114 6.1.3　实例114 6.2　理解聚类算法115 6.2.1　量化相似性115 6.2.2　k-means 聚类算法118 6.3　分层聚类的步骤122 6.4　编写分层聚类算法123 6.5　理解DBSCAN124 6.6　在Python中使用DBSCAN 创建簇125 6.7　评估聚类效果126 6.8　降维127 6.9　关联规则挖掘133 6.9.1　关联规则的类型133 6.9.2　关联分析算法136 6.10　小结141 第7章　传统的监督学习算法142 7.1　理解监督机器学习143 7.2　描述监督机器学习143 7.2.1　理解使能条件146 7.2.2　区分分类器和回归器146 7.3　理解分类算法147 7.3.1　分类器挑战性问题147 7.3.2　混淆矩阵153 7.3.3　理解召回率和精确度的权衡155 7.4　决策树分类算法162 7.4.1　理解决策树的分类算法162 7.4.2　决策树分类器的优势和劣势165 7.4.3　用例165 7.5　理解集成方法166 7.5.1　用XGBoost算法实现梯度提升 算法166 7.5.2　区分随机森林算法和集成提升 算法169 7.5.3　用随机森林算法求解分类器 挑战性问题169 7.6　逻辑回归170 7.6.1　假设171 7.6.2　建立关系171 7.6.3　损失函数和代价函数172 7.6.4　何时使用逻辑回归172 7.6.5　用逻辑回归算法求解分类器 挑战性问题173 7.7　支持向量机算法173 7.7.1　用支持向量机算法求解分类器 挑战性问题175 7.7.2　理解朴素贝叶斯算法175 7.8　贝叶斯定理176 7.8.1　计算概率176 7.8.2　和（AND）事件的乘法原则177 7.8.3　一般乘法原则177 7.8.4　或（OR）事件的加法原则177 7.8.5　用朴素贝叶斯算法求解分类器 挑战性问题178 7.9　各种分类算法的胜者178 7.9.1　理解回归算法179 7.9.2　回归器挑战性问题180 7.9.3　描述回归器挑战性问题180 7.9.4　了解历史数据集180 7.9.5　用数据管道实施特征工程181 7.10　线性回归182 7.10.1　简单线性回归182 7.10.2　评价回归器183 7.10.3　多元回归184 7.10.4　用线性回归算法求解回归器 挑战性问题185 7.10.5　何时使用线性回归185 7.10.6　线性回归的缺点185 7.10.7　回归树算法186 7.10.8　用回归树算法求解回归器 挑战性问题186 7.10.9　梯度提升回归算法186 7.10.10　用梯度提升回归算法求解 回归器挑战性问题187 7.11　各种回归算法的胜者188 7.12　实例—如何预测天气188 7.13　小结190 第8章　神经网络算法191 8.1　神经网络的演变192 8.1.1　时代背景192 8.1.2　人工智能之冬和人工智能之春193 8.2　理解神经网络194 8.2.1　理解感知器194 8.2.2　理解神经网络背后的原理195 8.2.3　理解分层的深度学习架构196 8.3　训练神经网络199 8.4　解析神经网络结构199 8.5　定义梯度下降200 8.6　激活函数202 8.6.1　阈值函数202 8.6.2　Sigmoid函数203 8.6.3　线性整流函数204 8.6.4　双曲正切函数206 8.6.5　Softmax函数207 8.7　工具和框架207 8.8　选择顺序性模型或功能性模型212 8.8.1　理解TensorFlow213 8.8.2　TensorFlow的基本概念213 8.8.3　理解张量数学214 8.9　理解神经网络的类型215 8.9.1　卷积神经网络215 8.9.2　生成对抗网络216 8.10　迁移学习217 8.11　案例研究：使用深度学习实现 欺诈检测218 8.12　小结221 第9章　自然语言处理算法222 9.1　自然语言处理简介222 9.2　理解自然语言处理术语223 9.3　使用Python清洗数据228 9.4　理解术语文档矩阵230 9.4.1　词频-逆文档频率231 9.4.2　结果摘要与讨论232 9.5　词嵌入简介232 9.6　利用Word2Vec实现词嵌入233 9.6.1　解释相似性得分234 9.6.2　Word2Vec的优点和缺点235 9.7　案例研究：餐厅评论情感分析236 9.7.1　导入所需的库并加载数据集236 9.7.2　构建一个干净的语料库：预处理 文本数据236 9.7.3　将文本数据转换为数值特征237 9.7.4　分析结果237 9.8　自然语言处理的应用238 9.9　小结238 第10章　理解序列模型239 10.1　理解序列数据240 10.2　序列模型的数据表示243 10.3　循环神经网络简介244 10.3.1　理解循环神经网络的架构244 10.3.2　在第一个时间步长 训练RNN246 10.3.3　时间反向传播250 10.3.4　基础RNN的局限性251 10.4　门控循环单元253 10.4.1　更新门简介254 10.4.2　实施更新门255 10.4.3　更新隐藏单元255 10.5　长短期记忆网络256 10.5.1　遗忘门简介257 10.5.2　候选细胞状态257 10.5.3　更新门258 10.5.4　计算记忆状态258 10.5.5　输出门259 10.5.6　将所有内容整合在一起259 10.5.7　编写序列模型260 10.6　小结265 第11章　高级序列建模算法266 11.1　高级序列建模技术的演变267 11.2　探索自动编码器267 11.2.1　编码一个自动编码器268 11.2.2　设置环境269 11.3　理解Seq2Seq模型271 11.3.1　编码器271 11.3.2　思想向量272 11.3.3　解码器或生成器272 11.3.4　Seq2Seq中的特殊标记272 11.3.5　信息瓶颈困境272 11.4　理解注意力机制273 11.4.1　注意力在神经网络中是什么273 11.4.2　注意力机制的三个关键方面274 11.4.3　深入探讨注意力机制275 11.4.4　注意力机制的挑战问题276 11.5　深入探讨自注意力276 11.5.1　注意力权重277 11.5.2　编码器：双向RNN278 11.5.3　思想向量278 11.5.4　解码器：常规RNN278 11.5.5　训练与推断279 11.6　Transformer：自注意力之后的神经 网络演变279 11.6.1　为什么Transformer出类 拔萃280 11.6.2　Python代码分解280 11.6.3　输出的理解281 11.7　大型语言模型282 11.7.1　理解LLM中的注意力机制282 11.7.2　探索自然语言处理的强大工具： GPT和BERT283 11.7.3　利用深度和广度模型创建强大 的LLM284 11.8　底部的表单284 11.9　小结285 第三部分　高级主题 第12章　推荐引擎288 12.1　推荐引擎简介289 12.2　推荐引擎的类型289 12.2.1　基于内容的推荐引擎289 12.2.2　协同过滤推荐引擎291 12.2.3　混合推荐引擎292 12.3　理解推荐系统的局限性294 12.3.1　冷启动问题294 12.3.2　元数据需求295 12.3.3　数据稀疏性问题295 12.3.4　推荐系统中社交影响是一把 双刃剑295 12.4　实际应用领域296 12.4.1　Netflix对数据驱动推荐的 掌握296 12.4.2　亚马逊推荐系统的演变296 12.5　实例—创建推荐引擎297 12.5.1　搭建框架297 12.5.2　数据加载：导入评论和标题297 12.5.3　数据合并：创建一个全面的 视图298 12.5.4　描述性分析：从评分中获取 信息299 12.5.5　为推荐系统构建结构：创建 矩阵299 12.5.6　测试引擎：推荐电影300 12.6　小结302 第13章　数据处理的算法策略303 13.1　数据算法简介304 13.1.1　CAP定理在数据算法背景下的 重要性304 13.1.2　分布式环境中的存储304 13.1.3　连接CAP定理和数据压缩304 13.2　CAP定理介绍305 13.2.1　CA系统306 13.2.2　AP系统306 13.2.3　CP系统307 13.3　解码数据压缩算法307 13.4　实例—AWS中的数据管理： 聚焦于CAP定理和压缩算法312 13.4.1　应用CAP定理312 13.4.2　使用压缩算法313 13.4.3　量化收益313 13.5　小结314 第14章　密码算法315 14.1　密码算法简介315 14.1.1　理解最薄弱环节的重要性316 14.1.2　基本术语316 14.1.3　理解安全性需求317 14.1.4　理解密码的基本设计319 14.2　理解加密技术的类型322 14.2.1　使用加密散列函数322 14.2.2　使用对称加密326 14.2.3　使用非对称加密327 14.3　实例—部署机器学习模型时的 安全问题331 14.3.1　MITM攻击332 14.3.2　避免伪装333 14.3.3　数据加密和模型加密333 14.4　小结335 第15章　大规模算法336 15.1　大规模算法简介336 15.2　描述大规模算法的高性能基础 设施337 15.2.1　弹性337 15.2.2　对设计良好的大规模算法进行 特征描述338 15.3　多资源处理的策略制定340 15.4　理解并行计算的理论限制341 15.4.1　阿姆达尔定律341 15.4.2　推导阿姆达尔定律341 15.4.3　CUDA：释放GPU架构在并行 计算中的潜力344 15.4.4　利用Apache Spark实现集群 计算的优势347 15.5　Apache Spark如何实现大规模的 算法处理349 15.5.1　分布式计算349 15.5.2　内存处理349 15.6　在云计算中使用大规模算法349 15.7　小结350 第16章　实际问题351 16.1　算法解决方案面临的挑战352 16.2　Twitter AI机器人Tay的失败353 16.3　算法的可解释性353 16.4　理解伦理与算法359 16.4.1　使用学习算法易出现的问题359 16.4.2　理解伦理考量360 16.4.3　影响算法解决方案的因素361 16.5　减少模型中的偏差362 16.6　何时使用算法362 16.7　小结364

商品参数

基本信息
出版社	机械工业出版社
ISBN	9787111783831
条码	9787111783831
编者	[加]伊姆兰·艾哈迈德(Imran Ahmad) 著
出版年月	2025-07-01 00:00:00.0
开本	16开
装帧	平装
页数	364
字数	499
版次	1
印次	1
纸张	一般胶版纸

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]