Glossar

Datenerweiterung

Verbessere deine Machine-Learning-Modelle mit Datenerweiterung. Entdecke Techniken, um die Genauigkeit zu erhöhen, die Überanpassung zu reduzieren und die Robustheit zu verbessern.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Datenerweiterung ist eine wichtige Technik beim maschinellen Lernen (ML), um die Größe und Vielfalt eines Trainingsdatensatzes künstlich zu erweitern. Dies geschieht durch die Erstellung modifizierter Versionen bestehender Datenpunkte oder die Erzeugung neuer synthetischer Beispiele auf deren Grundlage. Das Hauptziel ist es, die Leistung, Generalisierungsfähigkeit und Robustheit von ML-Modellen zu verbessern, insbesondere in Bereichen wie Computer Vision (CV), in denen die Beschaffung großer und vielfältiger Datensätze kostspielig und zeitaufwändig sein kann. Durch das Training von Modellen wie Ultralytics YOLO auf erweiterten Daten trainieren, können sie lernen, mit einer größeren Bandbreite an Variationen umzugehen, die in realen Szenarien vorkommen, was zu einer besseren Genauigkeit bei ungesehenen Daten führt.

Wie die Datenerweiterung funktioniert

Die Kernidee hinter der Datenerweiterung ist die Anwendung verschiedener Transformationen auf die ursprünglichen Datenbeispiele, um neue, plausible Trainingsbeispiele zu generieren. Diese Transformationen sollten idealerweise die Variationen widerspiegeln, auf die das Modell während der Inferenz stoßen könnte. Bei Bilddaten, die in der Computer Vision im Mittelpunkt stehen, werden häufig folgende Techniken angewandt:

  • Geometrische Transformationen: Ändern der räumlichen Eigenschaften des Bildes, z. B. Drehen, Skalieren (Vergrößern oder Verkleinern), Verschieben (Verschieben), Scheren und Spiegeln (horizontal oder vertikal).
  • Farbraumtransformationen: Ändern der Farbeigenschaften, einschließlich Anpassungen von Helligkeit, Kontrast, Sättigung und Farbton. Dadurch werden die Modelle unempfindlicher gegenüber Lichtverhältnissen und Kameraschwankungen.
  • Rauschen hinzufügen: Zufälliges Rauschen (z. B. Gaußsches Rauschen) einfügen, um Sensorrauschen oder mangelhafte Bildqualität zu simulieren.
  • Zufälliges Ausradieren / Ausschneiden: Das Ausblenden von zufälligen rechteckigen Bereichen eines Bildes, um das Modell dazu zu bringen, sich auf verschiedene Teile von Objekten zu konzentrieren und die Robustheit gegenüber Verdeckungen zu verbessern.
  • Bilder mischen: Das Kombinieren mehrerer Bilder oder Teile von Bildern. Techniken wie Mixup (Interpolation zwischen zwei Bildern und ihren Beschriftungen) und CutMix (Einfügen eines Ausschnitts aus einem Bild in ein anderes) zwingen das Modell dazu, aus weniger sauberen Beispielen zu lernen.

Neben dem Lebenslauf werden Augmentierungsverfahren auch in anderen Bereichen eingesetzt. In der natürlichen Sprachverarbeitung (NLP) zum Beispiel können Methoden wie die Ersetzung von Synonymen, die Rückübersetzung (Übersetzung von Text in eine andere Sprache und zurück) und das zufällige Einfügen/Löschen von Wörtern Textdaten ergänzen.

Wichtigkeit und Nutzen

Die Datenerweiterung ist aus mehreren Gründen ein wesentlicher Bestandteil des ML-Workflows:

  • Verbesserte Modellgeneralisierung: Indem das Modell mit mehr verschiedenen Beispielen konfrontiert wird, hilft ihm die Erweiterung, grundlegende Muster zu lernen, anstatt sich spezifische Trainingsbeispiele zu merken, was zu einer besseren Leistung bei neuen Daten führt.
  • Reduziertes Overfitting: Überanpassung tritt auf, wenn ein Modell bei den Trainingsdaten gut abschneidet, bei den ungesehenen Daten jedoch schlecht. Die Erweiterung wirkt wie eine Regularisierungstechnik, die es dem Modell erschwert, den begrenzten Originaldatensatz zu übererfüllen.
  • Erhöhte Robustheit: Modelle, die mit erweiterten Daten trainiert wurden, sind in der Regel widerstandsfähiger gegenüber Änderungen der Eingaben, wie z. B. Änderungen der Beleuchtung, des Blickwinkels, des Maßstabs oder teilweiser Verdeckungen.
  • Geringerer Bedarf an Datenerfassung: Es ermöglicht Entwicklern, mit kleineren Ausgangsdatensätzen bessere Ergebnisse zu erzielen und so Zeit und Ressourcen für die Datenerfassung und -beschriftung zu sparen. Weitere Tipps zum Modelltraining findest du in unserer Dokumentation.

Techniken und Werkzeuge

Die Implementierung von Datenerweiterungen wird durch verschiedene Bibliotheken und Frameworks erleichtert. Für Computer-Vision-Aufgaben sind unter anderem folgende Tools beliebt:

Ultralytics enthalten mehrere effektive integrierte Augmentierungsverfahren während des Trainings. Nutzer können ihre Datensätze verwalten und diese Funktionen über Plattformen wie Ultralytics HUB nutzen.

Anwendungen in der realen Welt

Die Datenerweiterung wird in zahlreichen KI-Bereichen eingesetzt:

  1. KI im Gesundheitswesen: Bei der Analyse medizinischer Bilder, z. B. bei der Erkennung von Tumoren in Scans, sind die Datensätze aufgrund von Datenschutzbedenken und der Seltenheit bestimmter Erkrankungen oft begrenzt. Durch Augmentierungsverfahren wie Rotation, Skalierung und Helligkeitsanpassung werden vielfältige Trainingsbeispiele erstellt, die den Modellen helfen, Anomalien trotz unterschiedlicher Bildgebungsgeräte oder Patientenpositionierung zuverlässig zu erkennen. Dies verbessert die diagnostische Genauigkeit von medizinischen Bildanalysesystemen.
  2. KI für die Automobilindustrie: Die Entwicklung von robusten Objekterkennungssystemen für autonome Fahrzeuge erfordert Trainingsdaten, die verschiedene Fahrszenarien abdecken. Die Erweiterung simuliert unterschiedliche Wetterbedingungen (z. B. durch Hinzufügen von künstlichem Regen oder Nebel), unterschiedliche Lichtverhältnisse (Tag, Nacht, Morgen-/Dämmerung) und Verdeckungen (z. B. teilweise verdeckte Fußgänger oder Fahrzeuge), damit die Wahrnehmungssysteme in unvorhersehbaren realen Umgebungen zuverlässiger werden.
  3. KI in der Landwirtschaft: Bei Aufgaben wie der Erkennung von Pflanzenkrankheiten oder dem Zählen von Früchten können Augmentierungen wetter- oder tageszeitbedingte Lichtschwankungen, unterschiedliche Wachstumsstadien oder Kamerawinkel von Drohnen oder Bodenrobotern simulieren und so zu robusteren Lösungen für die Präzisionslandwirtschaft führen.
  4. KI in der Produktion: In der Qualitätskontrolle kann die Augmentation Variationen in der Produktausrichtung, der Beleuchtung und kleinere Defekte erzeugen, um Modelle für eine zuverlässigere Erkennung von Anomalien an den Produktionslinien zu trainieren.

Datenerweiterung vs. synthetische Daten

Obwohl sowohl die Datenerweiterung als auch die Generierung synthetischer Daten darauf abzielen, die Trainingsdaten zu verbessern, unterscheiden sie sich grundlegend:

  • Datenerweiterung: Verändert vorhandene reale Daten durch Transformationen. Sie erhöht die Varianz um die beobachteten Datenpunkte, führt aber im Allgemeinen keine völlig neuen Szenarien ein, die in den ursprünglichen Daten nicht enthalten sind.
  • Synthetische Daten: Dabei werden völlig neue, künstliche Daten von Grund auf erstellt, oft mithilfe von Simulationen, Computergrafiken oder generativen Modellen wie Generative Adversarial Networks (GANs) oder Diffusionsmodellen. Synthetische Daten können Szenarien abbilden, die in der realen Welt selten oder unmöglich zu erfassen sind, und so Lücken füllen, die durch Augmentierung nicht geschlossen werden können.

In der Praxis ist die Datenerweiterung oft einfacher zu implementieren und rechnerisch billiger als die Erzeugung von synthetischen Daten mit hoher Genauigkeit. Beide Techniken können wertvoll sein, und manchmal werden sie kombiniert, um sehr vielfältige und robuste Trainingsdatensätze für anspruchsvolle KI-Anwendungen zu erstellen.

Alles lesen
OSZAR »