暂无商品咨询信息 [发表商品咨询]
本书以人体视觉理解为核心,系统地探讨了多数据源多任务学习在该领域的应用与挑战,提出了一种创新方法——混合监督学习(Mix-Supervised Learning,MSL)。混合监督学习通过共享主干网络,端到端地实现人体检测、人体实例分割、人体解析、人体姿态估计、密集姿态估计和实例级人体部位检测等6项任务的高效建模与预测。针对当前方法存在的精度与效率不足、任务间梯度竞争、多数据源适应性差等问题,本书提出了梯度均衡策略、实例级迁移学习、解析区域卷积网络和注意力激发感受野模块等创新技术。实验结果表明,混合监督学习在精度和效率上显著领先现有方法。
本书适合从事计算机视觉、多任务学习及相关领域研究的学者和工程师参考。
第1章 绪论
1.1 背景与意义
1.2 关键技术难题
1.3 主要内容与创新点
1.4 本书结构安排
第2章 面向人体视觉理解与多任务学习的研究现状
2.1 引言
2.2 人体视觉理解相关研究
2.2.1 人体检测与人体实例分割
2.2.2 人体部位检测
2.2.3 人体解析
2.2.4 人体姿态估计与密集姿态估计
2.3 多任务学习相关研究
2.3.1 多任务学习基本内容
2.3.2 多任务学习方法
2.3.3 多数据源多任务学习思想
2.3.4 多任务学习的评价基准
第3章 混合监督学习的基本模型
3.1 问题描述
3.2 混合监督学习的基本模型设计
3.2.1 模型的多任务数据源
3.2.2 模型的结构设计
3.3 实验结果与性能分析
3.3.1 相关实验设置
3.3.2 基础单/多任务实验对比
3.3.3 消融实验
3.3.4 模型性能分析
3.4 小结
第4章 用于混合监督学习的解析区域卷积网络
4.1 问题描述
4.2 具备全局语义信息的网络设计流程
4.2.1 几何和上下文编码模块
4.2.2 全局语义增强特征金字塔网络
4.2.3 解析重评分网络
4.2.4 高分辨率特征及大容量网络分支
4.3 实验结果与性能分析
4.3.1 相关实验设置
4.3.2 评价指标
4.3.3 消融实验
4.3.4 与先进方法的比较
4.4 混合监督习模型的消融实验
4.4.1 单任务实验
4.4.2 添加Parsing R-CNN网络的模型实验
4.5 小结
第5章 用于混合监督学习的空间注意力模块
5.1 问题描述
5.2 注意力激发感受野模块的设计流程
5.2.1 Air模块的设计思路
5.2.2 Air模块的实现流程
5.3 实验结果与性能分析
5.3.1 ImageNet数据集的实验结果
5.3.2 CIFAR-10和CIFAR-100数据集的实验结果
5.3.3 Air模块的有效性实验分析
5.4 混合监督学习模型的消融实验
5.4.1 单任务实验
5.4.2 添加AirNet网络的混合监督学习实验
5.5 小结
第6章 混合监督学习的可扩展性探究
6.1 问题描述
6.2 实例级人体部位数据集
6.2.1 数据集概述
6.2.2 数据统计
6.2.3 评价指标
6.3 实例级人体部位检测模型设计
6.3.1 模型设计思路
6.3.2 网络结构设计
6.4 实验结果与性能分析
6.4.1 主流检测器基准
6.4.2 数据集泛化能力实验
6.4.3 模型实验及性能分析
6.5 混合监督学习模型的消融实验
6.5.1 多数据源统计
6.5.2 任务可扩展性分析
6.5.3 模型实验及性能分析
6.6 小结
第7章 总结与展望
7.1 本书总结
7.2 未来工作
参考文献
| 基本信息 | |
|---|---|
| 出版社 | 北京邮电大学出版社 |
| ISBN | 9787563575558 |
| 条码 | 9787563575558 |
| 编者 | 杨录 宋晴 著 |
| 译者 | -- |
| 出版年月 | 2025-06-01 00:00:00.0 |
| 开本 | 其他 |
| 装帧 | 平装 |
| 页数 | 112 |
| 字数 | 191 |
| 版次 | 1 |
| 印次 | |
| 纸张 | 一般胶版纸 |
暂无商品评论信息 [发表商品评论]
暂无商品咨询信息 [发表商品咨询]