MIT的电子书 Foundations of Computer Vision 《计算机视觉基础》
地址: visionbook.mit.edu/
本书涵盖了计算机视觉领域的基础知识,从图像处理和机器学习的角度出发。我们希望通过包含许多可视化内容来建立读者的直观理解。目标读者是进入该领域的大一、研究生,但我们也希望经验丰富的从业者会发现本书同样有价值。
本书分为多个部分,每个部分包含几章,专注于计算机视觉中的一个连贯主题。建议按顺序阅读,因为大多数章节都假设读者熟悉它们之前涵盖的主题。各部分如下:
第一部分讨论了一些激励性主题,以介绍视觉问题并将其置于社会背景中。我们将介绍一个简单的视觉系统,这将让我们介绍全书将通用的概念,并复习一些基本的数学工具。
第二部分涵盖了图像形成过程。
第三部分涵盖了学习的基础,通过视觉示例介绍具有广泛适用性的概念。
第四部分介绍了信号和图像处理,这是计算机视觉的基础。
第五部分描述了一系列有用的线性滤波器(高斯核、二项式滤波器、图像导数、拉普拉斯滤波器和时域滤波器)及其一些应用。
第六部分描述了多尺度图像表示。
第七部分描述了用于视觉的神经网络,包括卷积神经网络、循环神经网络和 Transformer。这些章节将专注于主要原理,而不会深入描述具体的架构。
第八部分介绍了图像的统计模型和图形模型。
第九部分聚焦于神经网络时代两种强大的建模方法:生成式建模和表示学习。生成式图像模型是 统计图像模型 ,它们创建遵循自然图像形成规则和正确几何形状的合成图像。表示学习旨在寻找图像的有用抽象表示,例如向量嵌入。
第十部分由一些简短的章节组成,这些章节讨论了构建基于学习的视觉系统时出现的一些挑战。
第十一部分介绍了几何工具及其在计算机视觉中的应用,用于从二维图像中重建三维世界结构。
第十二部分 关注序列处理以及如何测量运动。
第十三部分 涉及场景理解和目标检测。
第十四部分 是一系列章节,为初级研究人员提供关于有效演示、撰写论文以及高效研究人员心态的建议。
第十五部分 回归简单的视觉系统,并将书中介绍的一些技术应用于第一部分引入的玩具问题。
#AI创造营##微博兴趣创作计划#
