暂无商品咨询信息 [发表商品咨询]
本书全面系统地梳理了基于文本理解的智能问答技术,涵盖从传统方法到现代深度学习技术的发展历程,重点聚焦于文本问答任务中的关键技术和前沿问题。
本书涉及智能问答不同领域的多种创新性技术,既有智能问答的背景、技术挑战及前沿问题的解读,又有技术实现和应用的具体指导,读者可以全方位掌握智能问答领域的重要研究问题与技术。
本书注重理论与实践结合,通过清晰的结构和易于理解的语言,力求帮助不同层次和需求的读者快速掌握该领域的核心内容。无论是学术研究人员、研究生还是工程师,都可以从本书中获得学术或技术方面的启发。
本书介绍了智能问答技术的发展历史和分类、基于文本理解的智能问答中的关键技术和前沿研究问题,包括基于多域检索和融合的文本问答方法、基于偏序关系排序的文本问答方法、基于文本阅读理解的场景文本视觉问答方法、基于对比学习语义补齐的场景文本视觉问答方法、基于先验知识的场景文本视觉问答方法,并对智能问答技术的未来进行了展望。本书内容前沿、理论与实践并重,适合作为人工智能、智能问答领域研究人员、技术人员的参考书,也适合作为人工智能相关专业本科生或研究生的教材。
殷绪成,教授、博导,模式识别与人工智能专家,国家杰出青年科学基金项目获得者、科技创新2030——“新一代人工智能”重大项目首席科学家,北京科技大学计算机与通信工程学院院长、模式识别与人工智能技术创新实验室主任,中国图象图形学学会文档图像分析与识别专委会副主任/秘书长、中国自动化学会模式识别与机器智能专委会委员、中国计算机学会计算机视觉专委会委员、中国人工智能学会模式识别专委会委员。主要研究领域包括模式识别、文字识别、计算机视觉、人工智能芯片、工业智能与工业软件技术及应用,在中国计算机学会推荐国际期刊和会议上发表论文一百多篇,连续四届荣获国际文档分析与识别大会技术竞赛共15项冠军,获2019年度北京市科技进步一等奖(第一完成人)、2018年度教育部科技进步二等奖(第一完成人)、2005年度北京市科技进步一等奖(主要成员)。
C O N T E N T S<br />目录<br /><br />前言<br /><br />第1章 智能问答概述1<br />1.1 引言1<br />1.2 智能问答简史4<br />1.3 智能问答系统的分类6<br />1.4 本章小结11<br /><br />第2章 基于文本理解的智能问答中的关键技术13<br />2.1 文本理解的相关技术13<br />2.1.1 机器阅读理解13<br />2.1.2 知识问答14<br />2.1.3 答案选择16<br />2.1.4 知识库的引入18<br />2.1.5 提示学习20<br />2.2 视觉与语言多模态学习21<br />2.2.1 注意力机制21<br />2.2.2 多模态融合23<br />2.2.3 图像-文本跨模态预训练24<br />2.3 视觉问答26<br />2.3.1 视觉问答方法26<br />2.3.2 场景文本视觉问答28<br />2.4 本章小结30<br /><br />第3章 基于多域检索和融合的文本问答方法31<br />3.1 引言31<br />3.2 方法概述33<br />3.3 查询处理33<br />3.3.1 查询精简34<br />3.3.2 查询扩增34<br />3.4 检索34<br />3.4.1 查询似然模型34<br />3.4.2 顺序依赖模型35<br />3.4.3 字段顺序依赖模型36<br />3.4.4 随机性临近散度模型38<br />3.5 多模式策略组合38<br />3.6 实验验证39<br />3.6.1 数据集和评价指标39<br />3.6.2 实验设置42<br />3.6.3 不同模型组合对模型性能的影响43<br />3.6.4 与前沿方法的对比实验46<br />3.6.5 与医学问答系统的对比实验47<br />3.6.6 实验结果分析49<br />3.7 本章小结51<br /><br />第4章 基于偏序关系排序的文本问答方法52<br />4.1 引言52<br />4.2 候选项与候选项模型53<br />4.3 用于答案选择的多任务学习57<br />4.4 实验验证59<br />4.4.1 数据集和评价指标59<br />4.4.2 实验设置60<br />4.4.3 WikiQA上的性能比较60<br />4.4.4 TRECQA上的性能比较61<br />4.4.5 Insurance QA上的性能比较63<br />4.4.6 BioASQ上的性能比较64<br />4.4.7 变体方法对比实验66<br />4.5 本章小结68<br /><br />第5章 基于文本阅读理解的场景文本视觉问答方法69<br />5.1 引言69<br />5.2 文本阅读理解73<br />5.2.1 图片处理73<br />5.2.2 问题理解73<br />5.2.3 场景文本和目标理解74<br />5.2.4 关系推理76<br />5.3 答案预测77<br />5.3.1 答案候选项生成77<br />5.3.2 答案语义匹配78<br />5.3.3 语义推理79<br />5.4 实验验证80<br />5.4.1 数据集和评价指标80<br />5.4.2 文本和目标检测识别模型82<br />5.4.3 不同模块对模型性能的影响83<br />5.4.4 OCR准确率对性能的影响86<br />5.4.5 与前沿方法的对比实验87<br />5.4.6 关键模块对答案预测的影响90<br />5.4.7 定性样例分析91<br />5.5 本章小结92<br /><br />第6章 基于对比学习语义补齐的场景文本视觉问答方法94<br />6.1 引言94<br />6.2 场景文本对比学习98<br />6.2.1 OCR文本语义表示98<br />6.2.2 OCR文本增强99<br />6.2.3 多模态融合100<br />6.2.4 OCR文本和单词对比学习100<br />6.2.5 损失函数101<br />6.3 答案预测101<br />6.4 实验验证103<br />6.4.1 数据集和评价指标103<br />6.4.2 与前沿方法的对比实验106<br />6.4.3 不同OCR文本语义表示的对比实验108<br />6.4.4 各个模块对模型性能的影响109<br />6.4.5 不同来源答案预测的对比实验110<br />6.4.6 STVQA数据集预测结果的对比分析111<br />6.4.7 TextCaps数据集的对比实验和结果展示113<br />6.5 本章小结115<br /><br />第7章 基于先验知识的场景文本视觉问答方法116<br />7.1 引言116<br />7.2 先验知识检索和验证117<br />7.2.1 OCR文本相关实体查询118<br />7.2.2 问题相关先验知识检索119<br />7.2.3 基于提示学习的先验知识验证119<br />7.3 先验知识融合推理120<br />7.3.1 场景文本和先验知识对齐120<br />7.3.2 多模态融合推理121<br />7.4 答案预测122<br />7.5 实验验证123<br />7.5.1 与前沿方法的对比实验124<br />7.5.2 不同提示模板预测准确率的对比127<br />7.5.3 各个模块对模型性能的影响129<br />7.5.4 不同数据子集的对比实验129<br />7.5.5 KgMr预测结果的对比分析130<br />7.6 本章小结132<br /><br />第8章 总结与展望133<br />8. 1研究总结133<br />8.2 未来展望134<br /><br />参考文献135
| 基本信息 | |
|---|---|
| 出版社 | 机械工业出版社 |
| ISBN | 9787111793656 |
| 条码 | 9787111793656 |
| 编者 | 晋赞霞 覃京燕 殷绪成 著 |
| 译者 | |
| 出版年月 | 2026-01-01 00:00:00.0 |
| 开本 | 16开 |
| 装帧 | 平装 |
| 页数 | 140 |
| 字数 | 175 |
| 版次 | 1 |
| 印次 | 1 |
| 纸张 | |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]