MIT的电子书 Foundations of Computer Vision 《计算机视觉基础》地址： visionbook.mit.edu/本书涵盖了计算机视觉领域的基础知识，从图像处理和机器学习的角度出发。我们希望通过包含许多可视化内容来建立读者的直观理解。目标读者是进入该领域的大一、研究生，但我们也希望经验丰富的从业者会发现

MIT的电子书 Foundations of Computer Vision 《计算机视觉基础》
地址： visionbook.mit.edu/
本书涵盖了计算机视觉领域的基础知识，从图像处理和机器学习的角度出发。我们希望通过包含许多可视化内容来建立读者的直观理解。目标读者是进入该领域的大一、研究生，但我们也希望经验丰富的从业者会发现本书同样有价值。

本书分为多个部分，每个部分包含几章，专注于计算机视觉中的一个连贯主题。建议按顺序阅读，因为大多数章节都假设读者熟悉它们之前涵盖的主题。各部分如下：

第一部分讨论了一些激励性主题，以介绍视觉问题并将其置于社会背景中。我们将介绍一个简单的视觉系统，这将让我们介绍全书将通用的概念，并复习一些基本的数学工具。
第二部分涵盖了图像形成过程。
第三部分涵盖了学习的基础，通过视觉示例介绍具有广泛适用性的概念。
第四部分介绍了信号和图像处理，这是计算机视觉的基础。
第五部分描述了一系列有用的线性滤波器（高斯核、二项式滤波器、图像导数、拉普拉斯滤波器和时域滤波器）及其一些应用。
第六部分描述了多尺度图像表示。
第七部分描述了用于视觉的神经网络，包括卷积神经网络、循环神经网络和 Transformer。这些章节将专注于主要原理，而不会深入描述具体的架构。
第八部分介绍了图像的统计模型和图形模型。
第九部分聚焦于神经网络时代两种强大的建模方法：生成式建模和表示学习。生成式图像模型是统计图像模型，它们创建遵循自然图像形成规则和正确几何形状的合成图像。表示学习旨在寻找图像的有用抽象表示，例如向量嵌入。
第十部分由一些简短的章节组成，这些章节讨论了构建基于学习的视觉系统时出现的一些挑战。
第十一部分介绍了几何工具及其在计算机视觉中的应用，用于从二维图像中重建三维世界结构。
第十二部分关注序列处理以及如何测量运动。
第十三部分涉及场景理解和目标检测。
第十四部分是一系列章节，为初级研究人员提供关于有效演示、撰写论文以及高效研究人员心态的建议。
第十五部分回归简单的视觉系统，并将书中介绍的一些技术应用于第一部分引入的玩具问题。
#AI创造营##微博兴趣创作计划#

发布于山东