Sözlük

İki Aşamalı Nesne Dedektörleri

Karmaşık bilgisayarla görme görevlerinde hassas nesne algılama için doğruluk odaklı çözümler olan iki aşamalı nesne algılayıcıların gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

İki aşamalı nesne dedektörleri, özellikle karmaşık sahnelerde yüksek doğruluklarıyla bilinen bir nesne algılama mimarisi sınıfını temsil eder. Benzerlerinin aksine, bu dedektörler nesne algılama görevini iki ayrı adıma ayırır: ilk olarak bir görüntüde nesne içerebilecek potansiyel bölgelerin belirlenmesi (bölge önerisi) ve ikinci olarak, önerilen bölgelerdeki nesnelerin sınıflandırılması ve sınırlayıcı kutular kullanılarak konumlarının hassaslaştırılması. Bu metodik yaklaşım detaylı analizlere olanak tanır ancak alternatif yöntemlere kıyasla genellikle hesaplama hızından ödün vermek zorunda kalınır. Bu modeller, bilgisayarla görmenin (CV) gelişiminde bir köşe taşıdır.

İki Aşamalı Dedektörler Nasıl Çalışır?

İki aşamalı bir dedektörün çalışması, özellik çıkarma için tipik olarak derin sinir ağlarından (NN), özellikle de Evrişimsel Sinir Ağlarından (CNN'ler) yararlanan sıralı bir boru hattı içerir.

  1. Aşama 1: Bölge Önerisi: İlk aşama, nesnelerin bulunma olasılığının yüksek olduğu yönetilebilir bir aday bölgeler (İlgi Bölgeleri veya RoI'ler) kümesi oluşturmayı amaçlar. R-CNN gibi ilk modeller Seçici Arama gibi harici yöntemler kullanırken, daha sonraki gelişmeler, özellikle de Daha Hızlı R-CNN mimarisi, bu adımı bir Bölge Öneri Ağı (RPN) kullanarak sinir ağının kendisine entegre etmiştir. RPN, omurga ağı tarafından üretilen özellik haritalarını verimli bir şekilde tarar ve potansiyel nesne konumlarını ve boyutlarını tahmin eder.
  2. Aşama 2: Sınıflandırma ve İyileştirme: İlk aşamada önerilen bölgeler daha sonra ikinci aşamaya geçirilir. Her bir RoI için, paylaşılan özellik haritasından özellikler çıkarılır (değişen bölge boyutlarını işlemek için RoIPooling veya RoIAlign gibi teknikler kullanılarak). Bu özellikler, iki görevi yerine getiren bir algılama kafasını besler: RoI içindeki nesneyi sınıflandırmak (örneğin, 'araba', 'kişi', 'arka plan') ve nesneye daha doğru bir şekilde uyması için sınırlayıcı kutunun koordinatlarını düzeltmek.

Temel Özellikler

İki aşamalı dedektörler öncelikle şu özelliklerle karakterize edilir:

  • Yüksek Doğruluk: Öneri oluşturma ve sınıflandırma/iyileştirmenin birbirinden ayrılması, ikinci aşamanın kaynaklarını daha küçük bir umut verici bölge kümesine odaklamasına olanak tanıyarak genellikle daha yüksek yerelleştirme ve sınıflandırma doğruluğuna yol açar. Küçük nesnelerde ve kalabalık sahnelerde iyi performans gösterme eğilimindedirler. Performans genellikle Ortalama Hassasiyet (mAP) ve Birlik Üzerinde Kesişim (IoU) gibi metrikler kullanılarak ölçülür.
  • Daha Yavaş Çıkarım Hızı: Görüntünün iki ayrı aşamada işlenmesi, özellikle de çok sayıda bölge önerisi oluşturma ve ayrı ayrı işleme ek yükü, bu dedektörleri hesaplama açısından daha yoğun ve genellikle tek aşamalı nesne dedektörlerine göre daha yavaş hale getirir. Bu durum, katı gerçek zamanlı çıkarım gerektiren uygulamalarda kullanımlarını sınırlayabilir.

Tek Aşamalı Dedektörlerle Karşılaştırma

Temel ayrım operasyonel boru hattında yatmaktadır. Tek aşamalı dedektörler, örneğin Ultralytics YOLO ailesi (aşağıdaki gibi modeller dahil YOLO11 ve YOLOv8) ve SSD (Single Shot MultiBox Detector), ağ üzerinden tek bir ileri geçişte tüm görüntüden sınırlayıcı kutuları ve sınıf olasılıklarını doğrudan tahmin eder. Nesne tespitini bir regresyon problemi olarak ele alırlar. Bu birleşik yaklaşım, önemli hız avantajları sağlayarak onları gerçek zamanlı uygulamalar için uygun hale getirir. Ancak geçmişte, özellikle küçük nesneler için iki aşamalı dedektörlerin doğruluğuyla eşleşen zorluklarla karşılaşmışlardır, ancak bu boşluk modern gelişmelerle önemli ölçüde daralmıştır. Daha fazla ayrıntı için farklı nesne algılama modelleri arasındaki karşılaştırmaları inceleyebilirsiniz.

Önemli Mimariler

İki aşamalı dedektörlerin evrimi birkaç etkili model içerir:

  • R-CNN (CNN özellikli bölgeler): Bölge önerilerini CNN özellikleriyle birleştiren ancak her bir bölgeyi bağımsız olarak işlemesi nedeniyle yavaş olan öncü çalışma.
  • Hızlı R-CNN: Paylaşılan bir evrişimli özellik haritası üzerinde RoIPooling kullanarak hesaplamayı teklifler arasında paylaştırarak hızı artırma.(Hızlı R-CNN Makalesi)
  • Daha hızlı R-CNN: Bölge önerisi adımını RPN aracılığıyla ağa entegre ederek hızı ve zarafeti daha da artırdı ve neredeyse uçtan uca eğitilebilir bir sistem oluşturdu.
  • Maske R-CNN: Algılanan her nesne için segmentasyon maskelerini tahmin etmek için bir dal ekleyerek örnek segment asyonu gerçekleştirmek için Genişletilmiş Daha Hızlı R-CNN.(Maske R-CNN Makalesi)

Gerçek Dünya Uygulamaları

İki aşamalı dedektörlerin yüksek doğruluğu, onları hassasiyetin çok önemli olduğu senaryolarda değerli kılar:

  • Tıbbi Görüntü Analizi: Tıbbi taramalarda (CT, MRI) küçük tümörler, lezyonlar veya polipler gibi ince anomalileri tespit etmek, tanıya yardımcı olmak için yüksek doğruluk gerektirir. Hassas lokalizasyon, tedavi planlaması için kritik öneme sahiptir. Sağlık hizmetlerinde yapay zeka ve Radiology gibi dergilerdeki araştırmalar hakkında daha fazla bilgi edinin : Yapay Zeka. İlgili görevler için Beyin Tümörü veri kümesi gibi veri kümelerini keşfedebilirsiniz.
  • Otonom Sürüş: Yayaları, bisikletlileri, diğer araçları ve trafik işaretlerini, özellikle de küçük veya kısmen kapalı olanları doğru bir şekilde tespit etmek ve yerlerini belirlemek, sürücüsüz araçların güvenlik sistemleri için çok önemlidir. Waymo gibi şirketler güçlü algılama sistemlerine büyük ölçüde güveniyor.
  • Ayrıntılı Sahne Anlayışı: Nesne etkileşimlerinin veya hassas sayımın ayrıntılı bir şekilde anlaşılmasını gerektiren uygulamalar daha yüksek doğruluktan yararlanır.
  • Üretimde Kalite Kontrol: Küçük kusurları belirlemek veya karmaşık montajlarda bileşen yerleşimini doğrulamak genellikle yüksek hassasiyet gerektirir. Üretimde yapay zeka hakkında daha fazla bilgi edinin.

Bu modellerin eğitimi genellikle COCO veri kümesi gibi büyük etiketli veri kümelerini ve dikkatli ayarlamayı içerir. Ultralytics , model eğitimi ve performans metriklerini anlamak için kaynaklar sağlar. Ultralytics , Ultralytics YOLO gibi verimli tek aşamalı modellere odaklanırken, iki aşamalı dedektörleri anlamak, daha geniş nesne algılama alanı içinde değerli bir bağlam sağlar.

Tümünü okuyun
OSZAR »