تعرف على كيفية تمكين الصناديق المحدودة من اكتشاف الأجسام، والذكاء الاصطناعي، وأنظمة التعلم الآلي. استكشف دورها في تطبيقات الرؤية الحاسوبية!
المربع المحدّد هو إطار مستطيل يُستخدم في الرؤية الحاسوبية للإشارة إلى الموقع والمدى التقريبي لجسم ما داخل صورة أو إطار فيديو. تُحدَّد هذه المربعات عادةً بإحداثيات الزاويتين العلوية اليسرى والسفلية اليمنى (أو نقطة المركز والعرض والارتفاع)، وتوفر هذه المربعات طريقة بسيطة وفعالة في الوقت ذاته لتحديد موقع الجسم ومقدار المساحة التي يشغلها. تُعد المربعات المحدودة مكونات أساسية في العديد من مهام السيرة الذاتية، بما في ذلك اكتشاف الأجسام وتتبع الأجسام والتعليق التوضيحي للصور، وتشكل حجر الزاوية للعديد من أنظمة الذكاء الاصطناعي الحديثة وأنظمة التعلم الآلي. إنها ضرورية لتمكين الآلات من فهم ليس فقط ما هي الأشياء الموجودة، ولكن أيضًا مكان وجودها في المشهد المرئي.
تعتبر المربعات المحدودة ضرورية لتدريب نماذج اكتشاف الكائنات وتقييمها. في المهام التي تعالجها نماذج مثل Ultralytics YOLO، تعمل المربعات المحدودة بمثابة "الحقيقة الأساسية" أثناء عملية التدريب. وهذا يعني أنها تمثل الموقع والحجم الصحيحين للأجسام في بيانات التدريب، مما يُعلِّم النموذج تحديد موقع الأجسام بدقة. تبدأ هذه العملية غالبًا بتعليقات توضيحية دقيقة للبيانات، حيث يقوم البشر أو الأدوات الآلية برسم هذه المربعات حول الأجسام في الصور، وغالبًا ما تستخدم منصات مثل CVAT أو تتكامل مع منصات مثل Ultralytics HUB لإدارة مجموعة البيانات. أثناء الاستدلال، يتنبأ النموذج المُدرَّب بالمربعات المُحددة حول الأجسام المكتشفة، إلى جانب تصنيفات الفئات ودرجات الثقة. تُعد هذه القدرة على التوطين أمرًا حيويًا للتطبيقات التي لا تتطلب تحديد الكائنات فحسب، بل أيضًا تحديد موقعها بدقة.
ترتبط العديد من المقاييس والتقنيات ارتباطًا وثيقًا باستخدام وتقييم المربعات المحدودة في نماذج التعلم الآلي:
بينما تحدد المربعات المحدودة القياسية (المحاذاة للمحور) موقع الأجسام باستخدام مستطيلات بسيطة، تقدم تقنيات الرؤية الحاسوبية الأخرى مستويات مختلفة من التفاصيل أو تتعامل مع سيناريوهات مختلفة:
تعد الصناديق المحدودة جزءًا لا يتجزأ من العديد من تطبيقات الذكاء الاصطناعي العملية: