Sözlük

ImageNet

Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

ImageNet, bilgisayarla görme (CV) araştırma ve geliştirmesinde yaygın olarak kullanılan çok büyük, temel bir veri kümesidir. Resmedilen nesneleri belirtmek için manuel olarak açıklanmış 14 milyondan fazla görüntü içerir. Bu görüntüler, English isimler, fiiller, sıfatlar ve zarflardan oluşan geniş bir sözcük veritabanı olan WordNet hiyerarşisine göre düzenlenmiştir ve bilişsel eşanlamlı kümeler (synsets) halinde gruplandırılmıştır. ImageNet, 20.000'den fazla kategorisiyle, özellikle görüntü sınıflandırma ve görüntü tanıma gibi görevler için makine öğrenimi (ML) modellerini eğitmek ve değerlendirmek için zengin ve çeşitli bir kaynak sağlar. Büyük ölçeği ve ayrıntılı açıklamaları, yapay zeka (AI) alanını ilerletmek için çok önemli olmuştur. ImageNet Veri Kümesi dokümantasyon sayfasında Ultralytics modelleri ile veri kümesini kullanma hakkında daha fazla bilgi edinebilirsiniz.

Önem ve Uygunluk

ImageNet'in kullanıma sunulması, özellikle bilgisayarla görme alanında derin öğrenme (DL) için çok önemli bir dönüm noktası olmuştur. ImageNet'ten önce, büyük, çeşitli ve iyi etiketlenmiş veri kümelerinin eksikliği ilerlemeyi engelleyen önemli bir darboğazdı. ImageNet gibi yüksek kaliteli veri kümeleri, Evrişimsel Sinir Ağları (CNN'ler) gibi çok daha derin ve karmaşık modellerin eğitilmesini sağlayarak görsel anlama görevlerinde önemli atılımlara yol açtı. 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), ImageNet'in bir alt kümesini kullandı ve görüntü sınıflandırma ve nesne alg ılama algoritmalarını değerlendirmek için standart karşılaştırma veri kümesi haline geldi. ImageNet üzerinde son teknoloji sonuçlar elde eden AlexNet ve ResNet gibi çığır açan modeller, modern CV mimarilerini büyük ölçüde etkilemiş ve büyük ölçekli veriler üzerinde derin öğrenmenin gücünü göstermiştir. Orijinal ILSVRC makalesi, zorluk ve etkisi hakkında daha fazla ayrıntı sunmaktadır.

ImageNet Uygulamaları

ImageNet'in birincil uygulaması, özellikle görüntü sınıflandırması için yeni bilgisayarla görme modellerinin ve algoritmalarının performansını(doğruluk, hız) değerlendirmek için standart bir ölçüt olarak hizmet etmektir. Yaygın olarak benimsenmesi, araştırmacıların sonuçları adil bir şekilde karşılaştırmasına olanak tanır. Kıyaslamanın ötesinde, ImageNet modellerin ön eğitimi için yaygın olarak kullanılmaktadır. Ön eğitim, bir modeli önce büyük ve genel ImageNet veri kümesi üzerinde eğiterek sağlam görsel özellikler öğrenmesini sağlar. Bu önceden eğitilmiş modeller, genellikle aşağıdaki gibi çerçeveler aracılığıyla kullanılabilir PyTorch ve TensorFlowdaha sonra transfer öğrenimi kullanılarak çeşitli alt görevler için daha küçük, daha spesifik veri kümeleri üzerinde ince ayar yapılabilir. Bu, hedef görev için gereken veri ve hesaplama miktarını önemli ölçüde azaltır ve özellikle hedef veri kümesi küçük olduğunda genellikle daha iyi performans sağlar. Birçok Ultralytics YOLO modeller, örneğin, ön eğitim stratejilerinden yararlanır. Ultralytics HUB gibi platformlar, bu tür teknikleri kullanarak modellerin eğitim sürecini kolaylaştırır.

Gerçek Dünyadan Örnekler

ImageNet'in etkisi akademik araştırmaların çok ötesinde pratik uygulamalara kadar uzanmaktadır:

  • Tıbbi Görüntü Analizi: ImageNet üzerinde önceden eğitilmiş modeller genellikle tıbbi görüntü analizindeki özel görevler için ince ayarlanır. Tıbbi görüntüler ImageNet fotoğraflarından önemli ölçüde farklı olsa da, öğrenilen temel görsel özellikler (kenarlar, dokular, temel şekiller gibi) güçlü bir başlangıç noktası sağlar. Bu yaklaşım, tıbbi görüntülemede tümör tespiti veya X-ışınları veya BT taramalarında anormalliklerin belirlenmesi gibi görevler için yapay zeka araçlarının geliştirilmesini hızlandırarak sağlık hizmetlerinde yapay zeka alanındaki ilerlemelere katkıda bulunur.
  • Otonom Sistemler: Otonom araçlardaki ve robotikteki algılama sistemleri büyük ölçüde yayalar, arabalar, trafik işaretleri ve engeller gibi nesneleri doğru bir şekilde tanımlamaya dayanır. Bu sistemlerin nesne tanıma bileşenlerinin ImageNet üzerinde önceden eğitilmesi, genel nesne özelliklerini öğrenmelerine yardımcı olarak belirli sürüş veya operasyonel ortam verileri üzerinde ince ayar yapıldığında sağlamlıklarını ve güvenilirliklerini artırır. Bu, Waymo tarafından kullanılan ve otomotiv çözümlerinde yapay zekaya entegre edilenler gibi teknolojilerin geliştirilmesine katkıda bulunur.

ImageNet ve İlgili Kavramlar

ImageNet'i desteklediği görevlerden ve diğer ilgili veri kümelerinden ayırmak önemlidir:

  • ImageNet ve CV Görevleri: ImageNet'in kendisi bir veri kümesidir, etiketlenmiş görüntülerden oluşan bir koleksiyondur. Görüntü Sınıflandırma (bir görüntüye tek bir etiket atama), Nesne Algılama ( sınırlayıcı kutularla nesneleri bulma) veya Görüntü Segmentasyonu ( örnek segmentasyonu ve semantik segmentasyon dahil olmak üzere her piksele bir etiket atama) gibi bir görev değildir. Bunun yerine, ImageNet öncelikle bu görevleri, özellikle de sınıflandırmayı gerçekleştiren modelleri eğitmek ve kıyaslamak için kullanılır.
  • ImageNet vs COCO: ImageNet sınıflandırma için standart olsa da COCO (Common Objects in Context) gibi veri kümeleri nesne algılama ve segmentasyon için daha yaygın olarak kullanılmaktadır. Bunun nedeni, COCO'nun görüntü başına birden fazla nesne için kesin sınırlayıcı kutular ve piksel başına segmentasyon maskeleri gibi bu görevler için gerekli daha ayrıntılı ek açıklamalar içermesi, ImageNet'in ise öncelikle görüntü düzeyinde etiketler sağlamasıdır (bazı nesne yerelleştirme verileri mevcut olsa da). Ultralytics , farklı görevler için çeşitli bilgisayarla görme veri kümelerini destekler.

İnanılmaz derecede etkili olsa da ImageNet, veri toplama dönemini ve kaynaklarını yansıtan potansiyel veri seti önyargıları da dahil olmak üzere sınırlamalara sahiptir ve bu da yapay zeka etiğinde önemli bir husustur.

Tümünü okuyun
OSZAR »