Sözlük

Model Ağırlıkları

Model ağırlıklarının makine öğrenimindeki önemini, tahminlerdeki rolünü ve Ultralytics YOLO adresinin yapay zeka görevleri için kullanımını nasıl basitleştirdiğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Model ağırlıkları, bir makine öğrenimi (ML) modelinin eğitim süreci sırasında öğrendiği temel parametrelerdir. Bu sayısal değerler, eğitim verilerinden elde edilen bilgiyi temsil eder ve modelin yeni, görülmemiş veriler üzerinde nasıl tahminler veya kararlar verdiğinin temelini oluşturur. Esasen ağırlıklar, bir sinir ağındaki (NN) nöronlar arasında olduğu gibi, model içindeki bağlantıların gücünü ve önemini belirler. Bunlar, model tarafından öğrenilen kalıpları yakalayan ayarlanabilir 'düğmelerdir'.

Model Ağırlıklarını Anlama

Çok sayıda ayarlanabilir düğmesi olan karmaşık bir makine düşünün; model ağırlıkları bu düğmeler gibi hareket eder. Model eğitimi sürecinde modele bir veri kümesinden örnekler gösterilir ve model ilk tahminlerini yapar. Bu tahminler ile gerçek doğru cevaplar (temel gerçek) arasındaki fark bir kayıp fonksiyonu ile ölçülür. Stokastik Gradyan İnişi (SGD) veya Adam gibi bir optimizasyon algoritması daha sonra bu kaybı en aza indirmek için geri yayılım gibi teknikler kullanarak bu ağırlıkları sistematik olarak ayarlar. Bu işlem birçok iterasyon veya epok boyunca tekrarlanır ve ağırlıklar kademeli olarak iyileştirilir.

Başlangıçta, ağırlıklar genellikle küçük rastgele değerlere ayarlanır, ancak eğitim yoluyla verilerdeki altta yatan kalıpları yakalayan değerlere yakınsarlar. Ağırlıkları, öğrenme oranı veya yığın boyutu gibi hiperparametrelerden ayırmak çok önemlidir. Hiperparametreler eğitim başlamadan önce ayarlanan yapılandırma ayarlarıdır ve öğrenme sürecinin kendisine rehberlik eder, oysa ağırlıklar eğitim sırasında öğrenilen parametrelerdir. NN'lerde ağırlıklarla birlikte sıklıkla bulunan bir başka öğrenilmiş parametre türü olan önyargılar, girdilerinden bağımsız olarak bir nöronun temel aktivasyon seviyesini temsil eder. Ağırlıklar girdilerin etkisini ölçeklendirirken, önyargılar aktivasyon fonksiyonunun çıktısını değiştirir.

Model Ağırlıklarının Önemi

Model ağırlıkları, eğitim verilerinden öğrenilen kalıpları ve ilişkileri doğrudan kodladıkları için kritik öneme sahiptir. İyi optimize edilmiş ağırlıklar, bir modelin daha önce karşılaşmadığı veriler üzerinde doğru tahminler yaparak iyi bir genelleme elde etmesini sağlar. Ağırlıkların kalitesi modelin doğruluk, kesinlik, geri çağırma ve sağlamlık gibi performans metriklerini doğrudan etkiler ve genellikle mAP gibi metriklerle özetlenir. Genellikle yetersiz veri, yetersiz eğitim süresi veya aşırı uyum (modelin eğitim verilerini gürültü de dahil olmak üzere çok iyi öğrenmesi) gibi sorunlardan kaynaklanan kötü eğitilmiş ağırlıklar, yeni veriler üzerinde güvenilmez tahminlere yol açar.

Birçok modern yapay zeka uygulamasında, özellikle de bilgisayarla görme (CV) alanında, modeller genellikle ImageNet veya COCO gibi büyük, genel veri kümeleri üzerinde önceden eğitilir. Elde edilen ağırlıklar, birçok görev için geçerli olan geniş görsel özellikleri yakalar. Ultralytics YOLO modelleri için mevcut olanlar gibi bu önceden eğitilmiş ağırlıklar, daha sonra doğrudan çıkarım için veya belirli bir görev veya özel veri kümesi üzerinde ince ayar yapmak için bir başlangıç noktası olarak kullanılabilir. Transfer öğrenmesi olarak bilinen bu teknik, eğitimi önemli ölçüde hızlandırır ve özellikle özel veriler sınırlı olduğunda genellikle daha iyi performans sağlar. Ultralytics HUB gibi platformlar, kullanıcıların veri kümelerini yönetmesine, modelleri eğitmesine ve ortaya çıkan model ağırlıklarını verimli bir şekilde işlemesine olanak tanır.

Gerçek Dünya Uygulamaları

Model ağırlıkları, sayısız yapay zeka uygulamasının arkasındaki motordur:

Ağırlıkların Yönetilmesi ve İzlenmesi

Modeller daha karmaşık hale geldikçe, ağırlıklarını ve bunları üreten deneyleri yönetmek, tekrarlanabilirlik ve işbirliği için çok önemli hale gelir. Weights & Biases (W&B) gibi araçlar, özellikle MLOps için bir platform sağlayarak ekiplerin hiperparametreleri, metrikleri, kod sürümlerini ve her deney için ortaya çıkan model ağırlıklarını takip etmesine olanak tanır.Weights & Biases" platformunun, bir sinir ağı içindeki parametreler olarak "ağırlıklar" ve "yanlılıklar" kavramlarından farklı olduğunu belirtmek önemlidir; platform, optimum weights and biases ve yanlılıkları bulma sürecini yönetmeye yardımcı olur. Belgelerde Ultralytics ' i W&B ile entegre etme hakkında daha fazla bilgi edinebilirsiniz. Verimli yönetim, hiperparametre ayarlamasından model dağıtımına kadar çeşitli görevler için aşağıdaki gibi çerçeveler kullanılarak anahtar rol oynar PyTorch veya TensorFlow.

Tümünü okuyun
OSZAR »