Sözlük

Güven

Yapay zeka güven puanlarını tanımlayın. Modellerin tahmin kesinliğini nasıl ölçtüğünü, güvenilirlik için eşikleri nasıl belirlediğini ve güveni doğruluktan nasıl ayırdığını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Yapay Zeka (AI) ve Makine Öğrenimi (ML) bağlamında güven, bir model tarafından tahminine atanan ve modelin söz konusu çıktıdan ne kadar emin olduğunu gösteren bir puanı temsil eder. Nesne alg ılama veya görüntü sınıflandırma gibi görevlerde, algılanan her nesne veya atanan sınıf etiketi, genellikle 0 ile 1 (veya %0 ile %100) arasında değişen bir güven puanı ile birlikte gelir. Bu puan, kullanıcıların aşağıdaki gibi modeller tarafından yapılan bireysel tahminlerin güvenilirliğini ölçmelerine yardımcı olur Ultralytics YOLO. Daha yüksek bir puan, modelin eğitim sırasında öğrenilen kalıplara dayanarak yaptığı tahmin konusunda daha emin olduğunu gösterir. Güveni anlamak, model çıktılarını yorumlamak ve özellikle otomotiv çözümlerinde yapay zeka gibi güvenlik açısından kritik uygulamalarda yapay zeka tahminlerine dayalı bilinçli kararlar almak için çok önemlidir.

Güven Nasıl Belirlenir?

Güven puanları genellikle bir sinir ağının (NN) çıkış katmanından elde edilir. Sınıflandırma görevleri için bu genellikle her sınıf için olasılık benzeri değerler üretmek üzere ham çıktılara (logitler) Softmax veya Sigmoid gibi bir aktivasyon fonksiyonunun uygulanmasını içerir. YOLO gibi nesne algılama modellerinde güven puanı, bir nesnenin önerilen bir sınırlayıcı kutuda bulunma olasılığını (genellikle "nesnellik puanı" olarak adlandırılır) ve bir nesnenin mevcut olması koşuluyla bu nesnenin belirli bir sınıfa ait olma olasılığını birleştirebilir. Bu, çıkarım işlemi sırasında tespitlerin geçerliliğini değerlendirmek için kullanılan önemli bir çıktıdır. Bu puan, COCO gibi veri kümelerinden öğrenilen model ağırlıklarına göre hesaplanır.

Güven Eşiği

Uygulamada, bir modelden gelen tüm tahminler eşit derecede faydalı veya güvenilir değildir. Çok düşük güven puanlarına sahip tahminler genellikle arka plan gürültüsünü veya belirsiz sınıflandırmaları temsil eder. Bunları filtrelemek için tipik olarak bir "güven eşiği" uygulanır. Bu, kullanıcı tarafından tanımlanan bir değerdir (örneğin, 0,5 veya %50); yalnızca bu eşiğin üzerinde bir güven puanına sahip tahminler geçerli çıktılar olarak kabul edilir. Uygun bir eşiğin belirlenmesi hayati önem taşır ve genellikle özel uygulamaya bağlıdır:

  • Yüksek Geri Çağırma Senaryoları: Tarama için tıbbi görüntü analizi gibi uygulamalarda, insan incelemesi gerektiren daha fazla yanlış pozitif anlamına gelse bile, potansiyel bulguları kaçırma olasılığını (yüksek geri çağırma) en aza indirmek için başlangıçta daha düşük bir eşik kullanılabilir. Sağlık hizmetlerinde yapay zeka genellikle dikkatli bir eşik ayarı gerektirir.
  • Yüksek Hassasiyetli Senaryolar: Otonom sürüş veya üretimde YZ'de kalite kontrolü gibi uygulamalarda, eylemlerin yalnızca son derece kesin tahminlere (yüksek hassasiyet) dayalı olarak gerçekleştirilmesini sağlamak ve hata riskini azaltmak için daha yüksek bir eşik tercih edilir. YZ güvenlik araştırmaları, sağlam karar vermeyi vurgulamaktadır.

Güven eşiği, aynı nesne için çakışan sınırlayıcı kutuları kaldırarak son algılama kümesini hassaslaştırmak için genellikle Maksimum Olmayan Bastırma (NMS) gibi tekniklerle birlikte çalışır. Ultralytics modellerini kullanırken bu eşiği komut satırı arayüzü (CLI) veya Python API aracılığıyla kolayca yapılandırabilirsiniz. Optimum eşiği bulmak hiperparametre ayarını içerebilir.

Gerçek Dünya Uygulamaları

Güven puanları, yapay zeka modellerinin sorumlu ve etkili bir şekilde kullanılmasında temel öneme sahiptir:

  1. Tıbbi Teşhis Desteği: Potansiyel anormallikler (tümör tespiti gibi) için tıbbi taramaları(röntgen veya MRI gibi) analiz eden sistemlerde, güven puanı vakaların önceliklendirilmesine yardımcı olur. Düşük güvene sahip bir tahmin, bir radyolog tarafından daha yakından incelenmesi gereken belirsiz bir bulguya işaret edebilirken, yüksek güvene sahip tahminler inceleme sürecini kolaylaştırabilir. Radyolojide Yapay Zeka araştırmaları genellikle güven seviyelerini tartışır.
  2. Otonom Sistemler: Sürücüsüz araçlar veya robotlar için güven puanları güvenlik açısından kritik öneme sahiptir. Bir yaya veya başka bir araç tespit edildiğinde(Waymo'nun yaklaşımı hakkında bilgi edinin) sistem frenleme veya yön değiştirme gibi bir eylem başlatmadan önce yüksek bir güven eşiğini karşılamalıdır. Düşük güvenilirlikli tespitler göz ardı edilebilir veya daha az kritik uyarıları tetikleyebilir. Bu, sistemin yalnızca kesin olduğunda kararlı bir şekilde hareket etmesini sağlar.

Güven ve Diğer Ölçütler

Tek bir tahminin güven puanını genel model değerlendirme metrikleriyle karıştırmamak önemlidir. Birbirleriyle ilişkili olsalar da performansın farklı yönlerini ölçerler:

  • Doğruluk: Tüm veri kümesi genelinde doğru tahminlerin genel yüzdesini ölçer. Model performansı hakkında genel bir fikir verir ancak bireysel tahminlerin kesinliğini yansıtmaz. Bir model yüksek doğruluğa sahip olabilir ancak yine de bazı tahminleri düşük güvenle yapabilir.
  • Hassasiyet: Gerçekten doğru olan pozitif tahminlerin oranını gösterir (Gerçek Pozitifler / (Gerçek Pozitifler + Yanlış Pozitifler)). Yüksek hassasiyet, daha az yanlış alarm anlamına gelir. Güven, modelin tahminine olan inancını yansıtır, bu da doğrulukla uyumlu olabilir veya olmayabilir.
  • Geri Çağırma (Hassasiyet): Modelin doğru tespit ettiği gerçek pozitif örneklerin oranını ölçer (Gerçek Pozitifler / (Gerçek Pozitifler + Yanlış Negatifler)). Yüksek geri çağırma, daha az gözden kaçan tespit anlamına gelir. Güven, kaç tane gerçek pozitifin bulunduğuyla doğrudan ilişkili değildir.
  • F1-Skor: Hassasiyet ve Geri Çağırma'nın harmonik ortalaması, her ikisini de dengeleyen tek bir metrik sağlar. Güven, tahmin düzeyinde bir puan olarak kalır.
  • Ortalama Ortalama Hassasiyet (mAP): Nesne algılamada farklı güven eşikleri ve sınıflar arasında hassasiyet-hatırlama eğrisini özetleyen yaygın bir metriktir. mAP hesaplaması güven eşiklerini içerirken, güven puanının kendisi her bir algılama için geçerlidir.
  • Kalibrasyon: Güven puanlarının gerçek doğruluk olasılığı ile ne kadar uyumlu olduğunu ifade eder. İyi kalibre edilmiş bir modelin %80 güvenle yaptığı tahminler zamanın yaklaşık %80'inde doğru olmalıdır. Modellerden elde edilen güven puanları her zaman doğal olarak iyi kalibre edilmiş değildir(kalibrasyonla ilgili araştırmalara bakınız).

Özetle, güven, gerçek dünya uygulamalarında daha iyi filtreleme, önceliklendirme ve karar vermeyi sağlayan bireysel AI tahminlerinin kesinliğini değerlendirmek için değerli bir çıktıdır. Ultralytics HUB'da izlenenler gibi bir modelin genel performansını değerlendiren metrikleri tamamlar, ancak onlardan farklıdır.

Tümünü okuyun
OSZAR »