暂无商品咨询信息 [发表商品咨询]
文本智能处理作为中文信息处理的关键领域,展现出广阔前景;Python以其强大的生态和易用性,已成为主流编程工具。然而,初学者如何系统掌握Python并将其有效应用于文本处理仍面临着挑战,本书旨在为初学者提供一条清晰实用的学习路径。本书面向初学者,系统梳理了用Python进行中文文本智能处理的完整路径。前4章夯实语言基础—数据结构、流程控制、正则表达式与规范编程范式;第5章及以后深入应用—语料库构建、网络爬虫、数据可视化,覆盖分词、向量化、相似度、分类聚类、情感分析及深度学习,配套案例代码,理实结合,快速上手。
首届重庆英才青年拔尖人才;重庆市第三批学术技术带头人后备人选;
目录
第1章 绪论 1
1.1 NLP概述 1
1.2 NLP基本流程 5
1.3 NLP的编程环境搭建 7
第2章 Python编程的数据结构 16
2.1 数字 16
2.2 字符串 19
2.3 列表 24
2.4 元组 29
2.5 集合 31
2.6 字典 33
2.7 数据类型转换 37
第3章 程序语句结构 40
3.1 顺序结构 40
3.2 分支结构 41
3.3 循环结构 44
3.4 其他语句结构 48
3.5 综合应用案例 53
第4章 正则表达式 56
4.1 初识正则表达式 56
4.2 正则表达式函数 56
4.3 正则表达式的元字符 62
4.4 正则表达式的应用 66
第5章 文本词汇层面的处理(上) 71
5.1 中文分词简介 71
5.2 中文分词的主要方法 72
5.3 中文分词工具jieba 77
5.4 文本词性标注 81
5.5 本章小结 84
第6章 文本词汇层面的处理(下) 87
6.1 文本关键词提取 87
6.2 命名实体识别 93
6.3 任务:中文命名实体识别 95
6.4 文本语义角色标记 102
第7章 图形绘制与词云图的生成 111
7.1 Matplotlib与图形绘制 111
7.2 词云图的生成 114
7.3 利用词频数据生成词云图 118
7.4 本章小结 121
第8章 文本向量化和文本语义相似度 126
8.1 文本向量化的概念 126
8.2 文本离散表示 126
8.3 文本分布式表示 138
8.4 文本语义相似度计算 141
第9章 文本分类与文本聚类 152
9.1 文本挖掘 152
9.2 文本分类常用算法 154
9.3 文本聚类常用算法 161
9.4 文本分类与文本聚类的步骤 171
9.5 任务:垃圾短信分类 172
9.6 任务:新闻文本聚类 175
9.7 本章小结 179
第10章 文本情感分析 182
10.1 文本情感分析简介 182
10.2 情感分析的常用方法 183
10.3 常用的情感分类模型 192
10.4 任务:基于情感词典的情感分析 197
第11章 爬虫技术 201
11.1 网络爬虫简介 201
11.2 运用正则表达式爬取网页数据 205
11.3 运用XPath爬取网络小说 208
11.4 运用bs4爬取网页数据 214
11.5 动态网页数据获取 217
第12章 NLP中的深度学习技术 227
12.1 前馈神经网络 227
12.2 循环神经网络 230
12.3 LSTM网络 232
12.4 深度学习工具 234
12.5 基于LSTM网络的文本分类与文本情感分析 237
第13章 语料库的构建与应用 255
13.1 语料库的概念 255
13.2 语料库的种类与构建原则 256
13.3 NLTK及其常用功能 259
13.4 语料库资源的获取 264
13.5 任务:语料库的构建与使用 265
附录 NLTK词性标注对照表 270
后记 272
| 基本信息 | |
|---|---|
| 出版社 | 科学出版社 |
| ISBN | 9787030830234 |
| 条码 | 9787030830234 |
| 编者 | 吴锋文 著 |
| 译者 | -- |
| 出版年月 | 2025-10-01 00:00:00.0 |
| 开本 | B5 |
| 装帧 | 平装 |
| 页数 | 306 |
| 字数 | 420000 |
| 版次 | 1 |
| 印次 | |
| 纸张 | |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]