Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.
ImageNet, bilgisayarla görme (CV) araştırma ve geliştirmesinde yaygın olarak kullanılan çok büyük, temel bir veri kümesidir. Resmedilen nesneleri belirtmek için manuel olarak açıklanmış 14 milyondan fazla görüntü içerir. Bu görüntüler, English isimler, fiiller, sıfatlar ve zarflardan oluşan geniş bir sözcük veritabanı olan WordNet hiyerarşisine göre düzenlenmiştir ve bilişsel eşanlamlı kümeler (synsets) halinde gruplandırılmıştır. ImageNet, 20.000'den fazla kategorisiyle, özellikle görüntü sınıflandırma ve görüntü tanıma gibi görevler için makine öğrenimi (ML) modellerini eğitmek ve değerlendirmek için zengin ve çeşitli bir kaynak sağlar. Büyük ölçeği ve ayrıntılı açıklamaları, yapay zeka (AI) alanını ilerletmek için çok önemli olmuştur. ImageNet Veri Kümesi dokümantasyon sayfasında Ultralytics modelleri ile veri kümesini kullanma hakkında daha fazla bilgi edinebilirsiniz.
ImageNet'in kullanıma sunulması, özellikle bilgisayarla görme alanında derin öğrenme (DL) için çok önemli bir dönüm noktası olmuştur. ImageNet'ten önce, büyük, çeşitli ve iyi etiketlenmiş veri kümelerinin eksikliği ilerlemeyi engelleyen önemli bir darboğazdı. ImageNet gibi yüksek kaliteli veri kümeleri, Evrişimsel Sinir Ağları (CNN'ler) gibi çok daha derin ve karmaşık modellerin eğitilmesini sağlayarak görsel anlama görevlerinde önemli atılımlara yol açtı. 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), ImageNet'in bir alt kümesini kullandı ve görüntü sınıflandırma ve nesne alg ılama algoritmalarını değerlendirmek için standart karşılaştırma veri kümesi haline geldi. ImageNet üzerinde son teknoloji sonuçlar elde eden AlexNet ve ResNet gibi çığır açan modeller, modern CV mimarilerini büyük ölçüde etkilemiş ve büyük ölçekli veriler üzerinde derin öğrenmenin gücünü göstermiştir. Orijinal ILSVRC makalesi, zorluk ve etkisi hakkında daha fazla ayrıntı sunmaktadır.
ImageNet'in birincil uygulaması, özellikle görüntü sınıflandırması için yeni bilgisayarla görme modellerinin ve algoritmalarının performansını(doğruluk, hız) değerlendirmek için standart bir ölçüt olarak hizmet etmektir. Yaygın olarak benimsenmesi, araştırmacıların sonuçları adil bir şekilde karşılaştırmasına olanak tanır. Kıyaslamanın ötesinde, ImageNet modellerin ön eğitimi için yaygın olarak kullanılmaktadır. Ön eğitim, bir modeli önce büyük ve genel ImageNet veri kümesi üzerinde eğiterek sağlam görsel özellikler öğrenmesini sağlar. Bu önceden eğitilmiş modeller, genellikle aşağıdaki gibi çerçeveler aracılığıyla kullanılabilir PyTorch ve TensorFlowdaha sonra transfer öğrenimi kullanılarak çeşitli alt görevler için daha küçük, daha spesifik veri kümeleri üzerinde ince ayar yapılabilir. Bu, hedef görev için gereken veri ve hesaplama miktarını önemli ölçüde azaltır ve özellikle hedef veri kümesi küçük olduğunda genellikle daha iyi performans sağlar. Birçok Ultralytics YOLO modeller, örneğin, ön eğitim stratejilerinden yararlanır. Ultralytics HUB gibi platformlar, bu tür teknikleri kullanarak modellerin eğitim sürecini kolaylaştırır.
ImageNet'in etkisi akademik araştırmaların çok ötesinde pratik uygulamalara kadar uzanmaktadır:
ImageNet'i desteklediği görevlerden ve diğer ilgili veri kümelerinden ayırmak önemlidir:
İnanılmaz derecede etkili olsa da ImageNet, veri toplama dönemini ve kaynaklarını yansıtan potansiyel veri seti önyargıları da dahil olmak üzere sınırlamalara sahiptir ve bu da yapay zeka etiğinde önemli bir husustur.