MIT 6.8300《Advances in Computer Vision》课程深度剖析计算机视觉前沿技术,专为具备深度学习和线性代数基础的研究生设计,旨在构建从几何理解到生成模型再到机器人感知的全景视角。
• 几何视觉核心:图像形成、经典与深度学习驱动的多视角几何、可微渲染与神经场景表示、光流估计与特征跟踪。
• 生成建模与表示学习:扩散模型原理与指导、条件概率模型、对比学习与掩码学习方法,结合图像和视频生成技术。
• 机器人视觉交叉:视觉驱动的决策规划与控制,面向具身智能体的感知策略与技能学习。
• 方法论洞察:课程强调理论与实践融合,要求掌握PyTorch深度网络训练、矩阵分解、傅里叶变换等线性代数工具,提升解决复杂视觉任务的核心能力。
• 评估体系:涵盖五个模块问题集(65%)与基于实验的研究项目(35%),鼓励通过博客形式呈现创新性实验结果及深度分析。
• 规范与创新:AI助手使用策略明确,鼓励合理借助工具但严禁代写,培养学术诚信与技术独立性。
• 讲座与辅导:定期名师客座讲座及丰富的线上线下答疑,助力学生跨越理论难点,强化实操技能。
持续跟踪计算机视觉几何与生成模型新趋势,系统构建视觉智能的理论与应用框架,助力未来科研与产业创新。
详情🔗 scenerepresentations.org/courses/2025/spring/advances-in-cv/
#计算机视觉# #深度学习# #生成模型# #机器人视觉# #神经渲染# #视觉几何#
发布于 北京
