术语表

计算机视觉(CV)

利用计算机视觉释放人工智能的潜能!探索计算机视觉在物体检测、医疗保健、自动驾驶汽车等领域的作用。立即了解更多信息!

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

计算机视觉(CV)是人工智能(AI)的一个专业领域,它使计算机和系统能够从数字图像、视频和其他视觉输入中获取有意义的信息。从本质上讲,它旨在复制人类的视觉理解能力,让机器能够 "看到"、解释并根据视觉数据做出决策。这需要使用复杂的算法和深度学习(DL)模型来处理视觉信息,从而识别物体、理解场景并提取高层次的见解。简单的图像处理主要侧重于增强或处理图像数据(如调整亮度或应用滤镜),而计算机视觉则不同,它寻求理解视觉中的内容上下文

人工智能和机器学习的重要性

计算机视觉是许多现代人工智能和机器学习(ML)系统的基础,它为机器通过视觉感知与物理世界进行交互和理解物理世界提供了必要的能力。受人类视觉皮层的启发,卷积神经网络(CNN)等技术的出现彻底改变了计算机视觉。这些网络允许模型从大量视觉数据中自动学习分层特征,从而显著提高了各种计算机视觉任务的准确性。这一进步使得以前无法实现的复杂应用得以实现,从而使 CV 成为当前人工智能发展的基石,并成为改变我们未来的人工智能用例的关键驱动力。

关键概念和任务

计算机视觉包含一系列旨在从视觉数据中提取不同类型信息的任务。一些核心任务包括

  • 图像分类为整幅图像指定一个标签或类别(例如,将图像识别为包含 "猫 "或 "狗")。ImageNet等数据集通常用于这项任务。
  • 物体检测识别图像中多个物体的存在和位置,通常是在物体周围绘制边框并指定类别标签(例如,在街道场景中定位所有 "汽车 "和 "行人")。像 Ultralytics YOLO等模型被广泛用于高效的物体检测。
  • 图像分割将图像中的每个像素归类为某个物体或区域。这比物体检测提供了更详细的了解。类型包括语义分割(按类别标记像素)和实例分割(区分同一类别中的单个对象实例)。请参阅实例分割和跟踪指南。
  • 姿势估计检测物体关键点的位置和方向,通常用于人体姿势估计(识别关节)或跟踪刚性物体。了解狗姿态估计的定制训练
  • 物体跟踪在视频序列的多个帧中识别并跟踪特定物体。它将物体检测与时间分析相结合。使用Ultralytics YOLOv8 探索物体检测和跟踪
  • 光流估计视频中连续帧之间物体或摄像机的运动。

计算机视觉与相关领域

将计算机视觉与相关学科区分开来很有帮助:

  • 图像处理:侧重于在较低层次处理图像,通常作为 CV 的预处理步骤。任务包括降噪、对比度增强以及使用OpenCV 等库进行过滤。图像处理修改像素,但不一定解释图像内容。了解更多有关计算机视觉和图像处理之间主要区别的信息
  • 机器视觉(MV):虽然与 CV 有重叠,但 MV 通常是指在工业环境中应用视觉技术进行自动检测、流程控制和机器人引导。MV 系统通常在受控环境中运行,具有特定的照明和摄像头设置,重点关注可靠性和速度,以完成特定任务,如制造业中的质量检测有关机器视觉的更多信息

技术和框架

开发计算机视觉应用依赖于各种工具、库和框架:

实际应用

计算机视觉应用在各行各业日益普及:

阅读全部
OSZAR »