Az Atışlı Öğrenme (FSL), Makine Öğreniminin (ML ) sınıf başına çok az sayıda, genellikle sadece bir avuç eğitim örneğinden genelleme yapabilen modeller tasarlamaya odaklanan bir alt alanıdır. Bu, tipik olarak büyük miktarlarda etiketli eğitim verisi gerektiren geleneksel Derin Öğrenme (DL) yaklaşımlarıyla keskin bir tezat oluşturur. Temel fikir, yalnızca bir veya iki örnek gördükten sonra yeni kavramları tanıyabildiğimiz insan öğrenmesinden esinlenmiştir. FSL, özellikle veri toplamanın pahalı, zaman alıcı veya doğası gereği sınırlı olduğu alanlarda çok önemlidir ve Yapay Zekayı (AI) daha uyarlanabilir ve veri açısından verimli hale getirir.
Az Atışlı Öğrenme Nasıl Çalışır?
Az Atışlı Öğrenme teknikleri, sınırlı verilerden yeni kavramları hızlı bir şekilde öğrenmek için önceki bilgilerden yararlanmayı amaçlar. Yaygın stratejiler şunları içerir:
- Meta-Öğrenme: Genellikle "öğrenmeyi öğrenme" olarak tanımlanan meta-öğrenme, bir meta-eğitim aşamasında çeşitli öğrenme görevleri üzerinde bir modelin eğitilmesini içerir. Bu, modelin az sayıda örnekle yeni bir göreve hızla adapte olabilen verimli bir öğrenme algoritması veya başlangıç parametreleri öğrenmesini sağlar. Bu amaçla çeşitli meta-öğrenme algoritmaları geliştirilmiştir.
- Transfer Öğrenimi: FSL genellikle büyük bir veri kümesi ( ImageNet veya COCO gibi) üzerinde önceden eğitilmiş bir modelle başlayarak Transfer Öğrenimini kullanır. Büyük veri kümesinden genel özellikleri zaten anlayan bu önceden eğitilmiş model, daha sonra belirli hedef görev için az sayıda mevcut örnek kullanılarak ince ayar yapılır. Bu yaklaşım, model ağırlıklarında gömülü olan genel bilgiden yararlanır.
- Veri Artırma: Veri artırma tekniklerini kullanarak mevcut az sayıdaki eğitim örneğinin varyasyonlarını oluşturmak, sınırlı veri kümesini genişletmeye yardımcı olabilir, ancak etkinliği son derece düşük veri rejimlerinde değişebilir. Gelişmiş artırma stratejilerine ihtiyaç duyulabilir.
Bu yöntemler, Sinir Ağlarının (NN ) göreve özgü minimum veriyle bile makul performans elde etmesini sağlar.
Az Atışlı Öğrenme ve İlgili Kavramlar
FSL'yi benzer öğrenme paradigmalarından ayırmak önemlidir:
- Sıfır Atışlı Öğrenme (ZSL): ZSL, eğitim sırasında hiç görülmemiş sınıflardan örnekleri sınıflandırmayı amaçlar. Bu genellikle, görülen ve görülmeyen veriler arasındaki boşluğu doldurmak için görülmeyen sınıfların metinsel açıklamaları veya öznitelikleri gibi yardımcı bilgiler kullanılarak gerçekleştirilir. Buna karşın FSL, her yeni sınıf için en az birkaç etiketli örnek gerektirir. ZSL, FSL ve Transfer Öğrenimine genel bir bakış daha fazla bağlam sağlayabilir.
- Tek Seferlik Öğrenme (OSL): OSL, modelin sadece bir etiketli örnekten yeni bir sınıfı tanımayı öğrenmesi gereken FSL'nin aşırı bir çeşididir. FSL ile aynı hedefleri paylaşır ancak daha katı veri kısıtlamaları altında çalışır.
- Transfer Öğrenimi: FSL genellikle transfer öğrenmeyi bir teknik olarak kullansa da, bu terimler birbirinin yerine kullanılamaz. Transfer öğrenme, bir hedef görevdeki performansı artırmak için kaynak görevdeki bilgiden yararlanmayı içeren daha geniş bir kavramdır. FSL, özellikle hedef görevin son derece sınırlı etiketli veriye sahip olduğu durumlarda etkili bir şekilde öğrenme zorluğunu ele alır.
Az Atışlı Öğrenme Uygulamaları
FSL, büyük veri kümelerinin elde edilmesinin pratik olmadığı veya imkansız olduğu senaryolarda yapay zeka uygulamalarına olanak sağlar:
- Nadir Hastalık Teşhisi: Tıbbi görüntü analizinde, teşhis modellerini eğitmek için çok sayıda nadir hastalık örneği elde etmek zordur. FSL, modellerin küçük bir hasta görüntüsü setinden bu tür durumları (örneğin, taramalardaki belirli tümör türleri) tanımlamayı öğrenmesini sağlayarak tanı ve araştırmayı potansiyel olarak hızlandırır. Bu, Radyoloji gibi dergilerde yayınlanan araştırmalarla Sağlık Hizmetlerinde Yapay Zeka için önemli bir alandır: Yapay Zeka.
- Özel Nesne Algılama: Bir üretim hattında yeni tasarlanmış bir ürünü veya yaban hayatı koruma görüntülerindeki nadir bir türü tanımlamak için bir Nesne Algılama modeline ihtiyaç duyduğunuzu düşünün. Binlerce etiketli görüntü elde etmek mümkün olmayabilir. FSL, bir modeli uyarlamak gibi özel modellerin eğitilmesine olanak tanır Ultralytics YOLOUltralytics HUB gibi platformları kullanarak, yeni nesne sınıfı başına yalnızca bir avuç örnekle model. Bu, özel Bilgisayarla Görme (CV) görevleri için dağıtımı hızlandırır.
- Düşük Kaynaklı Dil Çevirisi: Sınırlı dijital metne sahip diller için çeviri modellerinin eğitilmesi, Doğal Dil İşleme (NLP) kapsamında FSL tekniklerini gerektirir.
- Robotik: ICRA gibi konferanslarda sunulan araştırmalarda incelenen bir diğer uygulama da robotların(Robotik) yabancı ortamlardaki yeni nesneleri tanımayı ve bunlarla etkileşime girmeyi minimum düzeyde maruz kalarak hızlı bir şekilde öğrenmelerini sağlamaktır.
Zorluklar ve Gelecek Yönelimleri
Vaatlerine rağmen FSL, sağlanan belirli birkaç örneğe model duyarlılığı ve bu örneklerin ötesinde sağlam genelleme sağlamak gibi zorluklarla karşı karşıyadır. Bu kadar sınırlı veriyle aşırı uyumun üstesinden gelmek önemli bir engeldir. Devam eden araştırmalar, daha sağlam meta-öğrenme algoritmaları geliştirmeye, ön eğitim için denetimsiz öğren meden veya kendi kendine denetimli öğren meden daha iyi yararlanmaya ve düşük veri rejimlerinde genelleştirmeyi anlamak için teorik çerçeveler oluşturmaya odaklanmaktadır. Google AI ve Meta AI gibi kuruluşlar, yapay zeka sistemlerini daha esnek ve daha az veriye aç hale getirmeyi amaçlayarak FSL tekniklerini geliştirmeye aktif olarak katkıda bulunmaktadır.