热门搜索: 中考 高考 考试 开卷17
服务电话 024-23945002/96192
 

PYTHON自然语言理解:自然语言理解系统开发与应用实战

编号:
wx1203355569
销售价:
¥87.12
(市场价: ¥99.00)
赠送积分:
87
数量:
   
商品介绍

本书是一本全面介绍自然语言理解技术的实用指南,涵盖自然语言理解的常用技术和众多资源。书中不仅通过实际示例逐步解释自然语言理解方面的基本概念、常用技术及其应用方法,还详细讲解了每种技术的适用场景。此外,本书还介绍了实用的自然语言理解Python库,以及常见问题的解决方案,如数据收集、系统评估以及自然语言理解应用程序的部署等。通过阅读本书,你将熟悉自然语言理解、深度学习和大语言模型方面的基础知识,并掌握足够的技能,可以将所学知识应用于自然语言理解学术研究和实际的应用项目中。

本书的目标是为Python开发人员提供坚实的NLU基础知识。本书将深入探索自然语言理解相关实用技术,并帮助读者创建各种新颖实用的自然语言理解应用程序。本书共分为三部分:第1部分介绍了NLU的背景以及如何开始一个NLU项目;第二部分探讨了完成NLU任务所需要使用的Python工具和相关技术;第三部分讨论了在管理和部署NLU应用程序时应该考虑的因素,以及对NLU未来的展望。

黛博拉·达尔(Deborah A.Dahl)是 Conversational Technologies 公司的负责人,在自
然语言理解技术领域拥有超过 30 年的经验。她为科研机构、商业机构和政府部门开发了多个自然语言处理系统,其中包括为 NASA 开发的自然语言理解系统以及为安卓系统开发的语音和自然语言组件。多年来,黛博拉为众多客户提供了自然语言处理方面的咨询服务,积极参与了 20 多个自然语言处理方面的研讨会,并撰写了 70 多篇技术论文。本书是黛博拉在自然语言理解方面撰写的第四本著作。黛博拉在明尼苏达大学获得了语言学博士学位,并曾在宾夕法尼亚大学从事博士后研究,研究方向为认知科学。

前言
作者简介
审校者简介
第一部分  自然语言理解技术入门
第 1 章  自然语言理解方法与应用程序 2
1.1 自然语言基础知识 3
1.2 自然语言与字符编码 3
1.3 对话式人工智能与自然语言理解 4
1.4 交互式应用程序—聊天机器人与语音助手 5
1.4.1 通用语音助手 6
1.4.2 企业助手 6
1.4.3 翻译 7
1.4.4 教育 7
1.5 非交互式应用程序 8
1.5.1 分类 9
1.5.2 情感分析 9
1.5.3 垃圾邮件与网络钓鱼检测 9
1.5.4 虚假新闻检测 10
1.5.5 文档检索 10
1.5.6 分析 10
1.5.7 信息抽取 11
1.5.8 机器翻译 11
1.5.9 其他应用程序 11
1.5.10 应用程序类型总结 12
1.6 Python 自然语言处理展望 12
1.7 本章小结 13
第 2 章  识别自然语言理解问题 14
2.1 识别适合当前技术水平的问题 15
2.1.1 自然语言理解难以解决的问题 17
2.1.2 不需要自然语言理解的应用程序 21
2.1.3 训练数据 24
2.1.4 应用数据 25
2.2 开发成本 25
2.3 维护成本 26
2.4 决定是否使用自然语言理解的流程 27
2.5 本章小结 28
第二部分  自然语言理解系统开发与测试
第 3 章  自然语言理解方法 30
3.1 基于规则的方法 30
3.1.1 词与词典 31
3.1.2 词性标注 31
3.1.3 语法 32
3.1.4 句法分析 32
3.1.5 语义分析 32
3.1.6 语用分析 33
3.1.7 pipeline 33
3.2 传统的机器学习算法 34
3.2.1 文档表示 35
3.2.2 文档分类 35
3.3 深度学习方法 36
3.4 预训练模型 37
3.5 选择自然语言理解方法需要考虑的因素 37
3.6 本章小结 38
第 4 章  用于自然语言理解的Python 库与工具 39
4.1 技术要求 40
4.2 安装 Python 40
4.3 安装 JupyterLab 和 GitHub 41
4.3.1 JupyterLab 41
4.3.2 GitHub 42
4.4 常用的自然语言处理Python 库 42
4.4.1 NLTK 43
4.4.2 spaCy 45
4.4.3 Keras 47
4.4.4 其他自然语言处理Python 库 47
4.4.5 自然语言处理 Python库的选择 47
4.4.6 其他有用的 Python 库 48
4.5 一个示例 49
4.5.1 设置 JupyterLab 49
4.5.2 处理一句话 51
4.5.3 查看语料库属性 52
4.6 本章小结 56
第 5 章  数据收集与数据预处理 57
5.1 数据收集与数据标注 57
5.1.1 收集应用程序所需数据 58
5.1.2 收集科研项目所需数据 59
5.1.3 元数据 60
5.1.4 常用语料库 61
5.2 确保数据的隐私性并遵守道德准则 62
5.2.1 确保训练数据的隐私 63
5.2.2 确保运行时数据的隐私 63
5.2.3 人道地对待实验参与者 63
5.2.4 人道地对待众包工作者 63
5.3 数据预处理 64
5.3.1 删除非文本数据 64
5.3.2 文本正则化 66
5.3.3 拼写错误校正 72
5.4 针对具体应用程序的数据预处理 74
5.4.1 用类 token 替换单词和数字 74
5.4.2 修改数据 75
5.4.3 特定领域的停用词 75
5.4.4 删除 HTML 标记 75
5.4.5 数据不平衡问题 75
5.4.6 文本预处理 pipeline 75
5.5 选择合适的数据预处理方法 76
5.6 本章小结 77
第 6 章  数据探索与数据可视化 78
6.1 为什么要进行数据可视化 78
6.2 数据探索 80
6.2.1 频率分布 80
6.2.2 文档相似性度量 93
6.3 数据可视化注意事项 99
6.4 基于数据可视化信息对后续数据处理做出决策 102
6.5 本章小结 102
第 7 章  自然语言处理方法选择与数据表示 103
7.1 自然语言处理方法选择 103
7.1.1 选择适合任务的方法 104
7.1.2 从数据出发 104
7.1.3 计算效率 105
7.1.4 初步研究 105
7.2 自然语言处理应用程序中的语言表示 106
7.3 使用数学向量表示语言 108
7.4 使用上下文无关向量表示单词 114
7.5 使用上下文相关向量表示单词 117
7.6 本章小结 117
第 8 章  基于规则的方法 118
8.1 基于规则的方法简介 118
8.2 为什么要使用规则 119
8.3 正则表达式 119
8.3.1 使用正则表达式识别、分析和替换字符串 120
8.3.2 常用的正则表达式技巧 122
8.4 词汇级分析 122
8.4.1 词形还原 123
8.4.2 本体 123
8.5 句子级分析 125
8.5.1 句法分析 125
8.5.2 语义分析与槽填充 128
8.6 本章小结 133
第 9 章  机器学习第1部分—统计机器学习 134
9.1 模型评估方法简介 135
9.2 基于词频逆文档频率的文档表示与基于朴素贝叶斯算法的文档分类 136
9.2.1 词频逆文档频率 136
9.2.2 朴素贝叶斯文档分类 136
9.2.3 基于词频逆文档频率的文档表示与基于朴素贝叶斯算法的文档分类示例 137
9.3 基于支持向量机的文档分类 139
9.4 基于条件随机场模型的槽填充 141

商品参数
基本信息
出版社 机械工业出版社
ISBN 9787111758389
条码 9787111758389
编者 [美]黛博拉·A.达尔(DeborahA.Dahl) 著 李波 江凡 姚志浩 胡轲 刘行 译 译
译者 李波,江凡,姚志浩,胡轲,刘行
出版年月 2024-08-01 00:00:00.0
开本 16开
装帧 平装
页数 240
字数 317
版次 1
印次 1
纸张 一般胶版纸
商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]