Veri analitiği, verilerin veya istatistiklerin sistematik olarak hesaplamalı bir şekilde incelenmesini içerir. Yararlı bilgileri ortaya çıkarmak, sonuçlar çıkarmak ve bilinçli karar vermeyi desteklemek için verileri inceleme, temizleme, dönüştürme ve modelleme süreçlerini kapsar. Yapay zeka (AI) ve makine öğrenimi (ML) alanlarında veri analitiği, veri kümelerinin hazırlanması, Keşifsel Veri Analizi (EDA) gibi teknikler aracılığıyla veri özelliklerinin anlaşılması, anlamlı özelliklerin çıkarılması ve model performansının değerlendirilmesi için temeldir. Bu titiz analiz sonuçta, aşağıdaki gibi sofistike modeller de dahil olmak üzere daha sağlam ve güvenilir yapay zeka sistemlerinin oluşturulmasına katkıda bulunur Ultralytics YOLOnesne algılama gibi görevler için.
Yapay Zeka ve Makine Öğreniminde Veri Analitiğinin Önemi
Veri analitiği, başarılı yapay zeka ve makine öğrenimi projelerinin temelini oluşturur. Karmaşık modelleri eğitmeden önce ham verilerin kapsamlı bir şekilde analiz edilmesi gerekir. Bu, hataları ve tutarsızlıkları gidermek için veri temizleme ve verileri algoritmalara uygun şekilde biçimlendirmek için veri ön işleme gibi kritik adımları içerir. Genellikle Seaborn gibi araçların kullanıldığı veri görselleştirme ile geliştirilen EDA gibi teknikler, verilerin altında yatan örüntülerin, yapıların, aykırı değerlerin ve potansiyel önyargıların ortaya çıkarılmasına yardımcı olur. Bu hususların derinlemesine anlaşılması, uygun modellerin seçilmesi, veri kalitesinin sağlanması ve genellikle Ultralytics HUB gibi platformlarda yönetilen etkili eğitimin elde edilmesi için çok önemlidir.
Ayrıca, model eğitiminden sonra veri analitiği önemini korumaktadır. Model performansının değerlendirilmesi, doğruluk veya Ortalama Ortalama Kesinlik (mAP) gibi metrikleri kullanarak tahmin sonuçlarının temel gerçek verilerine göre analiz edilmesini içerir. KılavuzumuzdaYOLO performans metrikleri hakkında daha fazla bilgi edinebilirsiniz. Bu analitik süreç, model zayıflıklarının belirlenmesine, hata türlerinin anlaşılmasına (genellikle bir karışıklık matrisi kullanılarak görselleştirilir) ve hiperparametre ayarlama veya farklı model mimarilerini keşfetme gibi yöntemlerle iyileştirmelere rehberlik etmeye yardımcı olur. Gibi çerçeveler PyTorch ve TensorFlowve veri manipülasyonu için Pandas gibi kütüphaneler bu süreçte yaygın olarak kullanılan araçlardır.
Veri Analitiği ve İlgili Kavramlar
Birbiriyle ilişkili olsa da veri analitiği diğer bazı terimlerden farklıdır:
- Veri Madenciliği: Öncelikle büyük veri kümelerinde yeni, önceden bilinmeyen kalıpları ve ilişkileri keşfetmeye odaklanır. Veri analitiği genellikle bilinen veri yönlerini analiz etmeyi veya belirli hipotezleri test etmeyi içerir, ancak keşifsel keşfi de içerebilir. Bilgisayarla görmede veri madenciliğinin rolü hakkında daha fazla bilgi edinin.
- Makine Öğrenimi (ML): Açık programlama olmadan tahminler veya kararlar almak için verilerden (genellikle veri analitiği yoluyla hazırlanan ve analiz edilen) öğrenmek için algoritmalar kullanır. Analitik, ML modellerinin tükettiği içgörüleri ve hazırlanmış verileri sağlar. Makine öğrenimi yapay zekaya ulaşmak için bir yöntemken, veri analitiği verilere uygulanan bir süreçtir.
- Büyük Veri: Son derece büyük ve karmaşık veri kümelerini ifade eder. Veri analitiği, "büyük veri" olarak nitelendirilip nitelendirilmediğine bakılmaksızın verilerden değer ve içgörü elde etme sürecidir. Büyük veri anal itiği, analitik teknikleri özellikle bu büyük veri kümelerine uygular.
- Veri Görselleştirme: Veri ve bilgilerin grafiksel temsilidir. Verileri keşfetmek ve bulguları etkili bir şekilde iletmek için daha geniş bir veri analitiği sürecinde kullanılan önemli bir araçtır. TensorBoard entegrasyon kılavuzumuzdaki örneklere bakın.
- İş Zekası (BI): Genellikle, tipik olarak gösterge tabloları ve raporlar aracılığıyla iş kararlarını bilgilendirmek için geçmiş verileri kullanarak daha çok tanımlayıcı analitiğe (ne olduğu) odaklanır. Veri analitiği tanımlayıcı, tanısal, öngörücü ve kuralcı analitiği kapsayabilir. Gartner'ın BT Sözlüğü'nde daha fazlasını okuyun.
Gerçek Dünya Yapay Zeka/ML Uygulamaları
Veri analitiği, çok sayıda yapay zeka uygulamasında ilerleme kaydedilmesinde önemli bir rol oynuyor:
- Tıbbi Görüntü Analizi: Bir yapay zeka modeli tıbbi taramalardaki (X ışınları veya MRI'lar gibi) anormallikleri tespit etmeden önce, veri analitiği yoğun bir şekilde kullanılır. Ham görüntüler önceden işlenir (normalize edilir, yeniden boyutlandırılır) ve temizlenir. Keşifsel analiz, Beyin Tümörü veri kümesi gibi veri kümelerindeki görüntü kalitesi veya hasta demografisindeki farklılıkları anlamaya yardımcı olur. Analitik, ilgili özelliklerin belirlenmesine yardımcı olur ve tanı modelinin performansını(doğruluk, hassasiyet, özgüllük) uzman açıklamalarına göre değerlendirerek klinik kullanım için iyileştirmelere rehberlik eder. NIH Biyomedikal Veri Bilimi girişimi gibi kaynaklar bunun önemini vurgulamaktadır. Tıbbi görüntülemede tümör tespiti için YOLO modellerinin nasıl kullanılabileceğini görün.
- Yapay Zeka Odaklı Perakende Envanter Yönetimi: Perakendeciler stok seviyelerini optimize etmek ve israfı azaltmak için veri analitiğini kullanır. Bu, geçmiş satış verilerinin analiz edilmesini, mevsimsel eğilimlerin belirlenmesini ve müşteri satın almamodellerinin anlaşılmasını(tahmine dayalı modelleme) içerir. Ayrıca, analiz edilen görsel veriler kullanılarak eğitilen modellerle desteklenen bilgisayarla görme (CV) sistemleri, raf stokunu gerçek zamanlı olarak izleyebilir. Veri analitiği, algılama doğruluğunu analiz ederek ve envanter verilerini satış sonuçlarıyla ilişkilendirerek bu sistemlerin etkinliğini değerlendirir ve daha akıllı ikmal stratejileri sağlar. Sektör çözümleri için Perakende içinGoogle Cloud AI' yı keşfedin. Ultralytics , daha akıllı perakende envanter yönetimi ve yapay zeka ile perakende verimliliği elde etmek için yapay zeka hakkında içgörüler sunar.
Veri analitiği, sağlıktan tarıma ve üretime kadar çeşitli alanlarda etkili yapay zeka ve makine öğrenimi sistemleri oluşturmak, iyileştirmek ve doğrulamak için gereken kritik içgörüleri sağlar. Ultralytics HUB gibi platformları kullanmak, veri analizinden model dağıtımına kadar olan süreci kolaylaştırabilir.