自動運転やヘルスケアなどのAIアプリケーションにおける物体検出モデルの評価における平均平均精度(mAP)の重要性を発見してください。
平均平均精度(mAP)は、一般的なUltralyticsのような物体検出モデルの性能を評価するために広く使用されている指標です。 Ultralytics YOLOファミリーのような物体検出モデルの性能を評価するために広く使用されている指標です。mAPは、様々なクラスと信頼レベルにわたって物体を正しく識別し、位置を特定するモデルの能力を要約する単一の包括的なスコアを提供します。より単純なメトリクスとは異なり、mAPは、すべての関連オブジェクトを見つけること(リコール)と、見つかったオブジェクトが本当に正しいことを確認すること(精度)の間のトレードオフのバランスを効果的にとり、自律システムや医療診断のような複雑なアプリケーションで使用されるモデルを評価する上で非常に重要です。mAPを理解することは、コンピュータビジョン(CV)モデルの開発や導入に携わる人にとって不可欠です。
mAPを理解するには、まずPrecisionと Recallを把握することが不可欠である。物体検出の文脈では
mAPは、このトレードオフの異なるポイントにわたってモデルを評価する方法を提供し、パフォーマンスのよりバランスの取れたビューを提供します。WikipediaでPrecisionとRecallの基礎についてもっと知ることができます。
mAPの計算にはいくつかの段階があり、異なる物体クラスや検出しきい値にわたってモデルの性能をロバストに評価することができる:
多くの場合、mAPは特定のIntersection over Union(IoU)閾値で報告される。IoUは、予測されたバウンディングボックスとグランドトゥルース(実際の)バウンディングボックスの重なりを測定します。一般的なmAPのバリエーションは以下の通り:
これらのメトリクスがYOLO モデルにどのように適用されるかの詳細については、Ultralytics YOLO Performance Metricsガイドをご覧ください。
平均平均精度は、オブジェクト検出モデルのパフォーマンスを全体的に見ることができるため、非常に重要です。これは、学習データで定義されたすべてのクラスにわたる分類精度(オブジェクトクラスが正しいか)とローカライズ精度(バウンディングボックスが正しく配置されているか)の両方を同時に考慮します。このため、特に複数のオブジェクト・カテゴリーや不均衡なクラス分布を持つデータセットでは、精度やリコールを単独で見るよりも情報量が多くなります。一般的にmAPスコアが高いほど、よりロバストで信頼性の高いオブジェクト検出モデルであることを示します。注意深いデータ増強、ハイパーパラメータのチューニング、適切なモデルアーキテクチャの選択(例えば YOLO11のような)適切なモデル・アーキテクチャを選択することなどが、mAPを向上させるための一般的な戦略である。
mAPは、精度と信頼性が最優先される実世界のタスクでモデルを評価する上で非常に重要である:
その他の用途としては、セキュリティ監視、ロボット工学(ロボット工学にコンピュータ・ビジョンを統合)、小売分析(よりスマートな小売在庫管理のためのAI)、農業などがある。
mAPを機械学習(ML)で使われる関連評価指標と区別することは重要だ:
これらの違いを理解することは、特定のタスクと評価目標に基づいて適切なメトリックを選択するために極めて重要である。詳細については、「モデルの評価と微調整」ガイドを参照してください。
Ultralytics HUBのようなツールは、ユーザーがモデルの訓練、追跡、評価を行うことを可能にし、モデルの訓練と 検証の過程で重要なパフォーマンス指標としてmAPを目立たせている。以下のようなMLフレームワーク PyTorchや TensorFlowなどのMLフレームワークは、これらの物体検出モデルの構築と学習のための基礎となるコンポーネントを提供します。COCOや PASCAL VOCのような標準化されたデータセットは、公的なリーダーボードや研究論文で物体検出モデルを比較するための主要なメトリックとしてmAPを使用し、この分野の進歩を推進しています。Ultralytics モデル比較のページでは、mAPで測定される様々なモデルの性能を調べて比較することができます。