暂无商品咨询信息 [发表商品咨询]
本书以司法文本分析为核心,着重介绍自然语言处理技术的基本理论、算法和应用方法,并结合作者多年的研究成果,提出了一些智能司法文本分析的应用案例,为推进司法行政工作智能化,以智能技术减轻基层干警工作压力提出一种技术可行性发展路径。
目 录第一章 面向司法的NLP技术概述及应用1.1 自然语言及语义 1.1.1 自然语言与文字信息 1.1.2 自然语言与数学 1.1.3 自然语言语义1.2 自然语言处理 1.2.1 早期自然语言研究 1.2.2 基于统计方法的自然语言处理 1.2.3 自然语言处理技术的应用1.3 文本分析及其应用 1.3.1 文本分析的相关概念 1.3.2 文本分析的流程 1.3.3 文本分析的应用方向1.4 文本分析在司法工作智能化中的应用 1.4.1 人工智能技术的司法应用 1.4.2 司法领域的文本分析应用研究第二章 Python开发环境构建2.1 Python环境的选择 2.1.1 Python的开发环境 2.1.2 Python编程所需软件 2.1.3 Python版本的选择2.2 开发环境安装及配置方法 2.2.1 安装Anaconda 2.2.2 安装PyCharm 2.2.3 配置环境 2.2.4 安装jupyter notebook 2.2.5 scikit-learn开发环境配置2.3 基本操作方法 2.3.1 Anaconda界面介绍 2.3.2 Anaconda编写代码的过程第三章 构建司法文本语料库3.1 语料库概述 3.1.1 语料的概念 3.1.2 语料的收集 3.1.3 语料库 3.1.4 语料库构建原则 3.1.5 语料库的种类3.2 分词方法介绍 3.2.1 分词概述 3.2.2 为什么要分词 3.2.3 中英文分词的区别 3.2.4 中文分词算法3.3 利用分词器构建语料库 3.3.1 jieba分词器 3.3.2 语料库的制作3.4 语料库数据管理 3.4.1 语料库的数据管理方式的发展阶段 3.4.2 语料库的物理结构 3.4.3 语料库数据管理系统应具备的功能3.5 语料库读取器第四章 文本摘要4.1 文本摘要技术简介4.2 文本摘要方法分类4.3 关键短语提取 4.3.1 词语搭配 4.3.2 基于权重标签的短语提取4.4 TextRank文本摘要实例 4.4.1 TextRank关键词提取原理 4.4.2 提取关键词、短语和文本摘要实例4.5 主题模型 4.5.1 主题模型算法介绍 4.5.2 LSI算法理论及实例 4.5.3 LDA算法4.6 基于Gensim库的主题模型实例 4.6.1 实例数据准备 4.6.2 语料库的制作 4.6.3 LSI主题模型实例代码 4.6.4 LDA主题模型实例代码4.7 基于scikit-learn库的主题模型第五章 词向量推理方法5.1 传统特征工程模型 5.1.1 词袋模型 5.1.2 n-gram词袋模型 5.1.3 one-hot模型 5.1.4 TF-IDF模型5.2 高级特征工程模型 5.2.1 Word2Vec模型 5.2.2 GloVe模型 5.2.3 FastText模型 5.2.4 ELMO模型 5.2.5 OpenAI-GPT模型 5.2.6 BERT模型第六章 基于深度学习的NLP方法6.1 神经网络基础知识 6.1.1 感知机 6.1.2 认知偏置 6.1.3 反向传播算法 6.1.4 误差曲面 6.1.5 多种梯度下降算法 6.1.6 案例6.2 卷积神经网络 6.2.1 卷积神经网络的发展 6.2.2 卷积神经网络在自然语言处理上的应用 6.2.3 卷积神经网络的结构 6.2.4 卷积神经网络的主要特点 6.2.5 案例6.3 循环神经网络 6.3.1 循环神经网络的记忆功能 6.3.2 随时间反向传播算法 6.3.3 权重更新 6.3.4 循环神经网络的难点 6.3.5 案例6.4 长短期记忆网络(LSTM) 6.4.1 长短期记忆 6.4.2 随时间反向传播算法 6.4.3 字符级建模 6.4.4 其他记忆机制 6.4.5 案例6.5 注意力机制 6.5.1 注意力机制简介 6.5.2 注意力机制基本原理 6.5.3 注意力机制的各种方法 6.5.4 多头注意力机制应用实例第七章 基于文本分类的犯罪心理归因及风险评估7.1 文本分类 7.1.1 文本分类框架 7.1.2 数据预处理和规范化 7.1.3 构建训练和测试集 7.1.4 特征工程技术 7.1.5 构建分类模型 7.1.6 评估分类模型7.2 犯罪心理归因分析实战 7.2.1 加载和查看数据集 7.2.2 文本预处理 7.2.3 特征工程的构建及分类 7.2.4 模型训练及测试 7.2.5 雷达图表示7.3 犯罪心理归因结果分析第八章 基于相似性聚类的司法案例智能推荐8.1 基本概念 8.1.1 信息检索 8.1.2 特征工程 8.1.3 相似度度量 8.1.4 无监督的机器学习算法8.2 文本相似度8.3 分析词项相似度 8.3.1 汉明距离 8.3.2 曼哈顿距离 8.3.3 欧几里得距离 8.3.4 莱文斯坦编辑距离 8.3.5 余弦距离和相似度8.4 分析文档相似度8.5 构建司法案例推荐系统 8.5.1 司法案例数据集构建 8.5.2 司法案例数据集预处理 8.5.3 目标案例预处理 8.5.4 成对文档相似度的余弦相似度计算 8.5.5 司法案例推荐8.6 文档聚类 8.6.1 k均值聚类 8.6.2 近邻传播算法 8.6.3 凝聚层次聚类第九章 基于语言情感分析的亲情电话异常侦测9.1 前期准备 9.1.1 需求分析 9.1.2 多模态情感分析简介 9.1.3 项目数据集 9.1.4 框架流程介绍9.2 基于多模态的情感分析案例 9.2.1 案例创建 9.2.2 BERT模型模块介绍 9.2.3 小脚本文件介绍 9.2.4 run_classifier主函数 9.2.5 结果分析9.3 情感分析面临的挑战及研究方向参考文献
基本信息 | |
---|---|
出版社 | 法律出版社 |
ISBN | 9787524401261 |
条码 | 9787524401261 |
编者 | 高冠东著 著 |
译者 | -- |
出版年月 | 2025-08-01 00:00:00.0 |
开本 | 其他 |
装帧 | 平装 |
页数 | 406 |
字数 | 425000 |
版次 | 1 |
印次 | 1 |
纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]