Sözlük

Aktif Öğrenme

Daha az etiketle doğruluğu artıran uygun maliyetli bir makine öğrenimi yöntemi olan aktif öğrenmeyi keşfedin. Yapay zeka eğitimini nasıl dönüştürdüğünü öğrenin!

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Aktif Öğrenme, öğrenme algoritmasının, yeni veri noktaları için etiket talep etmek üzere genellikle "kahin" veya insan açıklamacı olarak adlandırılan bir kullanıcıyı etkileşimli olarak sorgulayabildiği Makine Öğrenimi (ML) içinde özel bir alt alandır. Tipik olarak büyük, önceden etiketlenmiş bir veri kümesi gerektiren geleneksel Denetimli Öğrenmenin aksine Aktif Öğrenme, önemli ölçüde daha az etiketleme çabasıyla yüksek model performansı elde etmeyi amaçlar. Bunu, ek açıklama için en bilgilendirici etiketlenmemiş örnekleri stratejik olarak seçerek yapar. Bu yaklaşım, etiketli veri elde etmenin pahalı, zaman alıcı olduğu veya tıbbi görüntü analizi veya karmaşık doğal dil işleme (NLP) görevleri gibi özel uzman bilgisi gerektiren alanlarda özellikle değerlidir. Temel fikir, modelin veri etiketleme sürecine rehberlik etmesine izin vermek ve insan çabasını model doğruluğunu artırmak için en etkili olacağı yere odaklamaktır.

Aktif Öğrenme Nasıl Çalışır?

Aktif Öğrenme süreci genellikle yinelemeli bir döngü izler ve modelin hedeflenen verilerle aşamalı olarak gelişmesine olanak tanır:

  1. İlk Model Eğitimi: Bir model, örneğin Ultralytics YOLOnesne algılama veya görüntü segmentasyonu için model, başlangıçta etiketlenmiş küçük bir veri kümesi üzerinde eğitilir.
  2. Etiketsiz Verilerin Sorgulanması: Eğitilen model, etiketlenmemiş veri havuzunda tahminler(çıkarım) yapmak için kullanılır.
  3. Sorgu Stratejisi Uygulaması: Bir sorgulama stratejisi, modelin en bilgilendirici etiketlenmemiş veri noktalarını (modelin en az emin olduğu veya en fazla yeni bilgi sağlaması beklenenler) seçmek için modelin tahminlerini (örneğin, tahmin güvenine veya belirsizliğine dayalı olarak) analiz eder.
  4. Oracle Ek Açıklaması: Seçilen veri noktaları, etiketleme için bir insan açıklayıcıya (kahin) sunulur. Etkili veri toplama ve açıklama uygulamaları burada çok önemlidir.
  5. Modelin Yeniden Eğitilmesi: Yeni etiketlenen veriler eğitim setine eklenir ve model bu genişletilmiş veri setiyle yeniden eğitilir (veya ince ayar yapılır).
  6. Yineleme: Döngü, istenen performans seviyesine ulaşılana, etiketleme bütçesi tükenene veya önemli ölçüde bilgilendirici örnek kalmayana kadar 2. adımdan itibaren tekrarlanır.

Sorgulama Stratejileri

Aktif Öğrenmenin etkinliği büyük ölçüde sorgulama stratejisine, yani hangi etiketlenmemiş veri noktalarının daha sonra etiketleneceğini seçmek için kullanılan algoritmaya bağlıdır. Amaç, etiketlendikten sonra model performansında en büyük iyileşmeye yol açacak örnekleri seçmektir. Yaygın stratejiler şunları içerir:

  • Belirsizlik Örneklemesi: Modelin tahmininden en az emin olduğu örnekleri seçer. Bu genellikle tahmin olasılığı, entropi veya en iyi tahminler arasındaki marj ile ölçülür.
  • Komite Tarafından Sorgulama (QBC): Bir model topluluğu kullanır. Komite üyelerinin tahmin konusunda en çok hemfikir olmadığı örnekler etiketleme için seçilir.
  • Beklenen Model Değişikliği: Etiketleri biliniyor olsaydı modelin parametrelerinde veya gradyanlarında en büyük değişikliğe neden olacak örnekleri seçer.
  • Yoğunluk Tabanlı Yaklaşımlar: Sadece belirsiz değil aynı zamanda temel veri dağılımlarını temsil eden örneklere öncelik verir.

Stratejilere kapsamlı bir genel bakış Burr Settles'ın Aktif Öğrenme literatür araştırması gibi kaynaklarda bulunabilir.

Uygunluk ve Faydalar

Aktif Öğrenme, sağlam Derin Öğrenme (DL) modellerinin geliştirilmesinde genellikle büyük bir darboğaz olan veri etiketleme ile ilgili yükü ve maliyeti önemli ölçüde azaltır. Ek açıklama çabalarını stratejik olarak odaklayarak, ekiplerin şunları yapmasına olanak tanır:

  • Daha Az Veri ile Daha Yüksek Doğruluk Elde Edin: Aynı etiketleme bütçesi göz önüne alındığında rastgele örneklemeye kıyasla daha iyi model performansı elde edin.
  • Etiketleme Maliyetlerini Azaltın: Manuel ek açıklama için harcanan zamanı ve kaynakları en aza indirin.
  • Model Geliştirmeyi Hızlandırın: En etkili verilere öncelik vererek istenen performans seviyelerine daha hızlı ulaşın. Aktif Öğrenmenin Bilgisayarlı Görü Geliştirmeyi Nasıl Hızlandırdığını Keşfedin.
  • Model Sağlamlığını İyileştirin: Belirsiz veya zor örneklere odaklanmak modellerin daha iyi genelleme yapmasına yardımcı olabilir.

Gerçek Dünya Uygulamaları

Aktif Öğrenme, etiketli verilerin bir kısıtlama olduğu çeşitli alanlarda uygulanmaktadır:

  • Tıbbi Görüntüleme: YOLO modelleri kullanılarak tümör tespiti gibi görevlerde, uzman radyologların zamanı değerlidir. Aktif Öğrenme, uzman kaynaklarının kullanımını optimize ederek inceleme için en belirsiz taramaları seçer. Bu, etkili sağlık hizmetleri yapay zeka çözümleri geliştirmek için çok önemlidir.
  • Doğal Dil İşleme (NLP): Duygu analizi veya adlandırılmış varlık tanıma (NER) gibi görevlerde, etiketleme için bilgilendirici metin örneklerinin (örneğin, belirsiz duygulara veya nadir varlıklara sahip olanlar) belirlenmesi model doğruluğunu verimli bir şekilde artırır. Gibi platformlardan araçlar Hugging Face genellikle bu tür tekniklerden yararlanır.
  • Otonom Araçlar: Ek açıklama için büyük miktarda etiketsiz sürüş verisi arasından zorlu veya nadir sürüş senaryolarının (örn. olağandışı hava koşulları, karmaşık kavşaklar) seçilmesi, otonom sürüş sistemlerinin güvenliğini ve güvenilirliğini artırmaya yardımcı olur.
  • Uydu Görüntü Analizi: Büyük uydu görüntüsü veri kümelerindeki belirli özelliklerin veya değişikliklerin belirlenmesi, modelin uzman incelemesi için belirsiz bölgeleri sorgulamasıyla hızlandırılabilir.

Aktif Öğrenme ve İlgili Kavramlar

Aktif Öğrenmeyi, etiketlenmemiş verileri de kullanan diğer öğrenme paradigmalarından ayırmak önemlidir:

  • Yarı Denetimli Öğrenme: Model eğitimi sırasında hem etiketli hem de etiketsiz verileri aynı anda kullanır. Aktif Öğrenmenin aksine, etiketler için belirli örnekleri seçici olarak sorgulamak yerine tipik olarak mevcut tüm etiketsiz verileri pasif olarak kullanır.
  • Kendi Kendine Denetimli Öğrenme: Ön görevler oluşturarak etiketsiz verilerden temsilleri öğrenir (örneğin, bir görüntünün maskelenmiş bir bölümünü tahmin etmek). Aktif Öğrenme etiketler için bir kehanete dayanırken, ön eğitim aşamasında insan açıklamasına ihtiyaç duymaz.
  • Pekiştirmeli Öğrenme: Bir ortamla etkileşimler yoluyla deneme yanılma yoluyla öğrenir, eylemler için ödüller veya cezalar alır. Aktif Öğrenme gibi açık etiketler için sorgulama içermez.
  • Federe Öğrenme: Verileri yerel tutarken merkezi olmayan cihazlarda modelleri eğitmeye odaklanır ve öncelikle veri gizliliği endişelerini giderir. Aktif Öğrenme verimli etiket edinimine odaklanır. Bu teknikler bazen birleştirilebilir.

Araçlar ve Uygulama

Aktif Öğrenmenin uygulanması genellikle makine öğrenimi modellerinin açıklama araçlarıyla entegre edilmesini ve veri iş akışının yönetilmesini içerir. Scikit-learn gibi çerçeveler ve kütüphaneler bazı işlevler sunarken, belirli görevler için özel kütüphaneler de mevcuttur. Label Studio gibi açıklama yazılımları, aktif öğrenme işlem hatlarına entegre edilebilir ve açıklama yapanların sorgulanan örnekler için etiket sağlamasına olanak tanır. Gibi platformlar DagsHub DagsHub Aktif Öğrenme Boru Hatları hakkındakiYOLO VISION 2023 konuşmasında tartışıldığı gibi, bu boru hatlarını oluşturmak ve yönetmek için araçlar sunmaktadır. Gelişen veri kümelerinin ve eğitilmiş modellerin etkili yönetimi çok önemlidir ve Ultralytics HUB gibi platformlar, geliştirme yaşam döngüsü boyunca bu varlıkları düzenlemek için altyapı sağlar. Ultralytics GitHub deposunu keşfedin ve gelişmiş makine öğrenimi tekniklerinin uygulanmasıyla ilgili tartışmalar ve kaynaklar için Ultralytics Topluluğuna katılın.

Tümünü okuyun
OSZAR »