用語集

バウンディング・ボックス

バウンディングボックスが物体検出、AI、機械学習システムをどのように実現するかを学びます。コンピュータ・ビジョン・アプリケーションにおけるバウンディング・ボックスの役割を探ります!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

バウンディングボックス(bounding box)とは、コンピュータビジョン(CV)において、画像やビデオフレーム内のオブジェクトの位置とおおよその範囲を示すために使われる矩形の枠のことである。通常、左上と右下の角(または中心点、幅、高さ)の座標によって定義され、これらのボックスは、オブジェクトがどこに位置し、どれだけの空間を占めるかを指定するためのシンプルで効果的な方法を提供します。バウンディングボックスは、物体検出、物体追跡、画像注釈を含む様々なCVタスクの基本的な構成要素であり、現代の多くの人工知能(AI)や機械学習(ML)システムの基礎となっている。バウンディングボックスは、どのような物体が存在するかだけでなく、それらが視覚シーンのどこに位置するかを機械が理解するために不可欠である。

物体検出における重要性

バウンディングボックスは、物体検出モデルの学習と評価の両方において極めて重要である。例えば Ultralytics YOLOのようなモデルが取り組むタスクでは、バウンディングボックスは学習プロセスにおける「グランドトゥルース(真実の根拠)」の役割を果たします。つまり、学習データ内のオブジェクトの正しい位置とサイズを表し、オブジェクトの位置を正確に特定するようモデルに教えます。このプロセスは、多くの場合、CVATのようなプラットフォームを使用したり、データセット管理のためにUltralytics HUBのようなプラットフォームと統合したりしながら、人間や自動化されたツールが画像内のオブジェクトの周りにこれらのボックスを描く、注意深いデータアノテーションから始まります。推論中、学習されたモデルは、クラスラベルと信頼度スコアとともに、検出されたオブジェクトの周りのバウンディングボックスを予測します。このローカリゼーション能力は、単に物体を識別するだけでなく、その正確な位置を必要とするアプリケーションには不可欠です。

バウンディング・ボックスに関する主な概念

MLモデルにおけるバウンディングボックスの使用と評価には、いくつかのメトリクスとテクニックが密接に関連している:

バウンディングボックスと関連用語

標準的な(軸合わせされた)バウンディングボックスは単純な矩形でオブジェクトを特定するが、他のコンピュータビジョン技術は異なる詳細レベルを提供したり、異なるシナリオを処理したりする:

実社会での応用

バウンディングボックスは、多くの実用的なAIアプリケーションに不可欠である:

  1. 自律走行車:自動運転車は、バウンディングボックスを使用して歩行者、他の車両、信号機、障害物を識別し、位置を特定するために、物体検出に大きく依存している。多くの場合、ディープラーニング・モデルによって実現されるこの空間認識は、安全なナビゲーションと意思決定に不可欠である。Waymoのような企業は、この技術を幅広く紹介している。Ultralytics 、自動運転車のAIに関する洞察を提供しています。
  2. リテール・アナリティクス:小売業では、バウンディングボックスは、棚上の商品を検出し、在庫レベルを監視し、棚とのインタラクションや足の往来パターン(オブジェクト・カウント)を通じて顧客の行動を分析することで、AI主導の在庫管理に役立ちます。
  3. セキュリティと監視バウンディングボックスは、自動化された監視システムがリアルタイムで個人や対象物を検出・追跡し、不正アクセスや不審な行動に対して警告を発することを可能にします。これは、セキュリティアラームシステムのようなアプリケーションを構築するための基礎となります。
  4. 医療画像解析:ヘルスケアでは、バウンディングボックスは、スキャン(X線、CT、MRI)の腫瘍や病変のような潜在的な異常を強調表示することにより、放射線科医や臨床医を支援し、より迅速かつ正確な診断に役立ちます。放射線学の例をご覧ください:人工知能と Ultralytics 医療画像解析の概要をご覧ください。
  5. 農業バウンディングボックスは、精密農業において、収穫のための果実の識別(果実検出)、作物の健康状態の監視、害虫の検出などの作業に使用される。
すべて読む
OSZAR »