新書推薦:

《
时刻人文·诺曼帝国:欧洲的缔造者、亚洲的征服者(诺曼人的辉煌全球史,征服英格兰,扩张帝国,主宰欧洲、
》
售價:HK$
74.8

《
德国现代化历程与德意志精神
》
售價:HK$
104.5

《
青少年拖延心理学:培养孩子的高效执行力
》
售價:HK$
54.8

《
股是股非之三:强势之星 全新修订全彩版
》
售價:HK$
135.3

《
摩洛哥史:沙海行舟 , 看世界 , 区域国别史(剑桥大学出版社经典版本)
》
售價:HK$
107.8

《
从“现象学语言”到日常语言:维特根斯坦大打字稿研究
》
售價:HK$
85.8

《
原来如此!人体运转的奥秘
》
售價:HK$
39.6

《
哲学的慰藉(三大狱中书简之一,波爱修斯绝笔之作,资深翻译家杨德友经典译本)
》
售價:HK$
71.5
|
| 編輯推薦: |
1、传统与智能深度融合,构建完整知识体系 遵循计算机视觉算法演化逻辑,将经典算法与前沿深度学习技术有机融合。从特征提取、目标检测到三维重建,均以“从传统方法到智能技术”为主线,帮助读者厘清技术发展脉络,构建统一、连贯、完整的知识体系。 2、零基础友好设计,轻松迈入视觉智能之门 充分考虑初学者的知识背景,从人类视觉感知原理讲起,循序渐进过渡到神经网络与视觉语言模型,语言通俗易懂,逻辑清晰缜密,是计算机、电子及相关交叉学科读者的理想入门之选。 3、知识实例化呈现,让抽象理论“看得见” 采用“知识实例化”的编写方式,将抽象算法转化为直观实例。通过大量具体案例演示算法流程,辅以全彩图表和可运行代码(基于Skimage、OpenCV、PyTorch),让复杂理论和模型结构变得生动易懂。 4、理论与实践深度绑定,锻造工程实践能力 理论教材与配套PyTorch实践教程风格统一、内容同步。理论讲解中的编程实例与实践教学的深度学习框架相对应,形成“理论学习-实践操作-知识巩固”的完整闭环。 5、教学资源丰富,助力高效教与学 每章配备精选习题,涵盖基础巩固、代码实践与前沿技术探讨,帮助读
|
| 內容簡介: |
本书系统整合了计算机视觉领域的经典算法与现代智能视觉技术,全面介绍了该领域的核心理论与方法体系。本书内容丰富,涵盖了以下主要知识点:计算机视觉基本概念及技术基础、人类视觉感知与图像特征多层表达、图像特征与图像对齐、二值图像分析、区域分割、纹理特征分析、相机成像模型和标定技术、光流计算、三维重建、传统目标检测与识别算法、传统目标跟踪算法、智能目标识别与跟踪、三维点云特征及理解、视觉语言模型等。來源:香港大書城megBookStore,http://www.megbook.com.hk 本书适合作为计算机科学与技术、软件工程及电子类专业本科生、研究生的教材或教学参考书,也可供从事计算机视觉应用与研究的开发人员和科研人员使用。对于计算机视觉先行课程知识欠缺的读者,本书提供了循序渐进、易于理解的学习路径,帮助他们系统掌握计算机视觉算法原理和关键技术。
|
| 關於作者: |
|
谢源,现任华东师范大学计算机科学与技术学院教授、博导,国家优青,闽江学者讲座教授,人社部“香江学者”。于2010年和2013年分别获得厦门大学计算机系和中国科学院自动化所工学硕士和博士学位。2014年获国家人社部和博管会的资助,授予“香江学者”的称号,赴香港理工大学计算机系从事两年的博士后研究工作。历任中国科学院自动化研究所助理研究员(2013)和副研究员(2016)。
|
| 目錄:
|
第 1章 计算机视觉基础1 1.1 概述1 1.1.1 计算机视觉概念1 1.1.2 计算机视觉的发展历史及应用2 1.1.3 与其他学科之间的关系7 1.1.4 计算机视觉算法流程9 1.2 数字图像基础11 1.2.1 数字图像基本概念11 1.2.2 数字图像质量影响因素16 1.2.3 数字图像基本运算18 1.2.4 数字图像的空域处理20 1.2.5 图像滤波处理21 1.3 机器学习与人工智能技术22 1.3.1 人工智能技术的发展22 1.3.2 机器学习概念及常用算法23 1.3.3 机器学习与深度学习27 1.3.4 深度学习技术的发展29 1.3.5 神经元与人工神经网络30 1.3.6 神经网络结构32 1.3.7 卷积神经网络34 1.4 计算机视觉编程基础37 1.4.1 Python语言简介37 1.4.2 图像处理的软件包39 1.4.3 深度学习编程框架40 1.4.4 深度学习编程实例43 习题45 第 2章人类视觉感知与图像特征多层 表达46 2.1 人眼结构与视觉特性46 2.1.1 人眼结构46 2.1.2 人眼视觉特性47 2.1.3 人类视觉感知48 2.1.4 颜色感知与色彩空间50 2.1.5 视觉感知特征及作用54 2.2 图像的多层次表达55 2.2.1 图像金字塔与人类的感知55 2.2.2 图像金字塔技术的作用56 2.3 滤波器57 2.3.1 滤波器概念57 2.3.2 空域滤波器58 2.3.3 频域滤波处理67 2.3.4 图像滤波与金字塔生成71 2.4 深度学习的多层特征72 2.4.1 图像的卷积运算72 2.4.2 卷积神经网络及多层特征74 习题75 第3章图像特征与图像对齐77 3.1 图像特征及常见类型77 3.2 点特征80 3.3 边缘特征85 3.4 区域特征92 3.5 多视图及特征对应95 3.6 特征匹配技术97 3.7 图像对齐技术基础99 3.8 全局图像对齐101 3.8.1 基于几何变换的对齐102 3.8.2 基于投影变换的对齐103 3.9 智能图像对齐104 3.9.1 块对齐算法104 3.9.2 最优匹配点的智能图像对齐 算法105 3.9.3 智能几何变换对齐106 3.9.4 智能关键点匹配算法107 习题108 第4章二值图像分析109 4.1 二值图像概念109 4.2 二值图像的创建110 4.3 连通性及连通成分标记 111 4.4 区域的边界 113 4.5 图像骨架化113 4.6 数学形态学处理方法115 4.6.1 数学形态学基本运算117 4.6.2 数学形态学处理算法121 4.7 二值图像的应用实例126 习题127 第5章 区域分割128 5.1 区域分割概念128 5.2 传统图像分割128 5.2.1 阈值分割法128 5.2.2 基于区域的分割技术136 5.2.3 基于轮廓的分割技术139 5.3 图像语义概念147 5.4 语义分割技术发展及CNN基础148 5.5 基于深度学习的语义分割151 5.5.1 基于FCN的语义分割技术151 5.5.2 其他语义分割网络153 5.5.3 基于注意力机制的语义分割156 5.6 基于区域的智能分割算法158 习题160 第6章纹理特征分析161 6.1纹理的定义及分类161 6.2纹理特征分析的常用方法162 6.3基于纹理的分类与识别166 6.4图像修复167 6.5图像风格化处理174 习题179 第7章相机成像模型和标定技术180 7.1从3D到2D的成像180 7.2相机成像模型182 7.3摄像机标定技术基础184 7.4对极几何与摄像机自标定188 7.5智能成像模型学习方法190 习题192 第8章光流计算193 8.1光流概念193 8.2光流估计的用途194 8.3运动场与光流的关系195 8.4光流估计方法196 8.5基于深度学习的光流估计201 8.6基于光流的智能表情分析实例203 习题205 第9章三维重建206 9.1三维重建基础206 9.2三维场景表达方法206 9.2.1立体表面表达206 9.2.2空间点云表达208 9.2.3体表达209 9.2.4体素表达210 9.2.5深度映像表达211 9.3三维形状重建212 9.3.1基于明暗恢复形状212 9.3.2基于纹理恢复形状213 9.4主动视觉与被动视觉重建214 9.4.1主动视觉重建214 9.4.2被动视觉重建217 9.5智能三维重建算法221 9.5.1单幅图像重建技术221 9.5.2神经辐射场重建223 9.5.3DeepSDF重建224 习题226 第 10章传统目标检测与识别算法227 10.1目标识别概念227 10.2目标识别算法分类228 10.3目标识别算法流程229 10.4滑动窗口目标检测算法232 10.5目标识别词袋算法233 10.6基于AdaBoost的人脸检测算法235 习题238 第 11章传统目标跟踪算法239 11.1目标跟踪概念239 11.2目标跟踪技术难点240 11.3运动目标检测与跟踪241 11.4传统跟踪算法基础241 11.5典型目标跟踪算法244 11.5.1核跟踪算法基础244 11.5.2均值漂移算法244 11.6卡尔曼滤波器跟踪算法246 11.7相关滤波运动跟踪算法248 习题249 第 12章智能目标识别与跟踪251 12.1智能目标识别算法基础251 12.2R-CNN算法252 12.3SPP-Net算法252 12.4Fast R-CNN算法254 12.5Faster R-CNN算法255 12.6YOLOv1算法256 12.7SSD算法257 12.8YOLOv2算法259 12.9YOLOv3算法260 12.10基于YOLO的其他跟踪算法261 习题263 第 13章三维点云特征及理解265 13.1点云滤波处理与表达266 13.1.1点云滤波基础266 13.1.2点云关键点提取与描述267 13.1.3点云体素化与稀疏化表达269 13.2点云特征描述方法270 13.2.1点云特征描述子271 13.2.2特征描述的算法实例276 13.3智能点云运算算法实例276 13.3.1智能点云运算技术的发展276 13.3.2PointNet算法277 13.3.3PointNet++算法280 13.3.4PointConv算法281 13.4三维点云语义理解282 13.5三维点云目标分类284 习题286 第 14章视觉语言模型287 14.1语言模型技术基础287 14.1.1语言模型的词嵌入287 14.1.2预训练语言模型288 14.1.3 大语言模型技术及发展292 14.2视觉语言模型基础293 14.3端到端的视觉语言模型296 14.3.1CLIP模型296 14.3.2ALBEF模型298 14.3.3VLMo300 14.3.4BLIP模型301 14.3.5CoCa模型302 14.3.6BEiT-3模型304 14.4基于预训练的视觉语言模型305 14.4.1BLIP-2模型305 14.4.2InstructBLIP模型305 14.4.3MiniGPT-4模型306 14.4.4LLaVA模型307 14.4.5VisualGLM-6B模型308 14.4.6CogVLM模型309 14.4.7MiniGPT-5模型310 14.4.8GPT-4V模型311 14.5稳定扩散模型312 14.5.1扩散模型313 14.5.2去噪扩散概率模型313 14.5.3LDM314 14.5.4SDM315 习题316
|
|