Wenn ein Mensch eine Szene oder ein Bild betrachtet, versteht er es – welche Objekte sich darin befinden und was passiert, wenn eine Aktion stattfindet. Ein Computer hingegen verarbeitet nur digitale Daten, die den Farbwert jedes Pixels beschreiben. Für einen Menschen ist es mühelos, eine Pizza auf einem überladenen Tisch zu erkennen. Aber bis vor kurzem waren Computer nicht in der Lage, dieselbe Aufgabe auszuführen.

Computer Vision oder CV ermöglicht es einem Computer, wichtige Informationen aus visuellen Eingaben zu erkennen und basierend auf diesen Informationen genaue Vorhersagen und Empfehlungen zu treffen.

Wie funktioniert Computer Vision?

Um ein Programm zu erstellen, das ein bestimmtes Bild erkennt, musste eine Person vor der Computer Vision stundenlange manuelle Beinarbeit verrichten. Zunächst müsste eine Datenbank mit ähnlichen Bildern zusammengestellt werden.

Diese Bilder müssten dann manuell analysiert, vermessen und mit relevanten Daten versehen werden dass der Forscher dachte, das fragliche Objekt identifizieren zu können (wie Farbe, Maße und gestalten). Erst dann könnte Software verwendet werden, um Vorhersagen zu treffen.

instagram viewer

Auf der anderen Seite automatisiert Computer Vision diesen gesamten Prozess mithilfe eines maschinellen Lernansatzes, der als Deep Learning bekannt ist. Deep Learning verwendet ein mehrschichtiges neuronales Netzwerk mit Hunderten von möglichen Schichten. Bei Bildern handelt es sich in der Regel um ein Convolutional Neural Network (CNN).

Im Detail zu erklären, wie Deep Learning und neuronale Netze funktionieren, würde den Rahmen dieses Artikels sprengen. Grundsätzlich werden große Datenmengen in das neuronale Netz eingespeist. Das neuronale Netz analysiert die Daten wiederholt, bis es genaue Vorhersagen darüber treffen kann.

Im Fall eines CNN, das für eine Computer-Vision-Aufgabe verwendet wird, führt das neuronale Netzwerk die Daten durch mehrere Schritte. Zunächst wird das Bild in mehrere Teile (einzelne Pixel oder Pixelgruppen, die zuvor mit Tags versehen wurden) kollabiert.

Dann macht es Vorhersagen darüber, was sich in verschiedenen Teilen des Bildes befindet (wie harte Kanten oder bestimmte Objekte). Es überprüft die Genauigkeit dieser Vorhersagen wiederholt und ändert jedes Mal Teile des Algorithmus geringfügig, bis er sehr genau wird.

Computer sind heute so leistungsfähig, dass sie ein Bild viel schneller analysieren können als das menschliche Gehirn, insbesondere wenn sie gelernt haben, bestimmte Muster zu erkennen. Auf diese Weise ist leicht zu erkennen, wie ein Deep-Learning-Algorithmus die menschlichen Fähigkeiten übertreffen könnte.

Welche Arten von Computer Vision gibt es?

Computer Vision beinhaltet das Analysieren und Verstehen von Bildern und die Ausgabe relevanter Vorhersagen oder Entscheidungen über die Bilder. Es gibt verschiedene Aufgaben, die Computer Vision verwenden wird, um diese Ziele zu erreichen. Einige davon sind:

  • Bildklassifizierung: Der Bildtyp wird erkannt. Zum Beispiel, ob es sich um das Gesicht, die Landschaft oder den Gegenstand einer Person handelt. Diese Art von Aufgabe kann verwendet werden, um Bilder schnell zu identifizieren und zu klassifizieren. Eine Verwendung hierfür besteht darin, unangemessene Inhalte in sozialen Medien automatisch zu erkennen und zu blockieren.
  • Objekterkennung: Ähnlich wie bei der Bildklassifizierung kann die Objekterkennung ein bestimmtes Objekt innerhalb einer Szene identifizieren – wie eine Pizza auf einem überladenen Tisch.
  • Kantenerkennung: Eine häufige Anwendung von Computer Vision und normalerweise der erste Schritt bei der Objekterkennung ist die Identifizierung der harten Kanten in einem Bild.
  • Objektidentifikation: Dies ist die Erkennung einzelner Beispiele eines Objekts oder Bildes, wie die Identifizierung einer bestimmten Person, Fingerabdrücke oder ein Fahrzeug.
  • Objekterkennung: Erkennung ist die Identifizierung eines bestimmten Merkmals in einem Bild, wie beispielsweise eines gebrochenen Knochens in einer Röntgenaufnahme.
  • Objektsegmentierung: Dies ist die Identifizierung, welche Pixel im Bild zu dem fraglichen Objekt gehören.
  • Objektverfolgung: In einer Videosequenz kann ein einmal erkanntes Objekt problemlos im gesamten Video verfolgt werden.
  • Bildwiederherstellung: Unschärfe, Rauschen und andere Bildartefakte können entfernt werden, indem genau identifiziert wird, wo sich das Objekt im Vergleich zum Hintergrund im Bild befindet.

Beispiele für Computer Vision

Künstliche Intelligenz ist bereits in mehreren Branchen eingesetzt mit einer atemberaubenden Wirkung, die für Computer Vision gilt. Hier einige Beispiele für bereits heute verwendete Lebensläufe.

Gesichtserkennung

Die Gesichtserkennung ist heute eine der wichtigsten Einsatzmöglichkeiten von Computer Vision. Im Vergleich mit Datenbanken bekannter Gesichter können Computer-Vision-Algorithmen einzelne Personen sehr genau identifizieren.

  • Social Media analysiert Bilder und markiert Benutzer automatisch, für die es eine gute Auswahl an Bildern hat.
  • Laptops, Telefone und Sicherheitsgeräte können Personen identifizieren, um den Zugriff zu ermöglichen.
  • Die Strafverfolgungsbehörden verwenden Gesichtserkennung in CCTV-Systemen, um Verdächtige zu identifizieren.

Medizin

Computer Vision wird derzeit im Gesundheitswesen verwendet, um schnellere und genauere Diagnosen zu stellen, als Experten stellen können. Viele Anwendungen beinhalten die Analyse von Röntgen-, CT- oder MRT-Bildern für bestimmte Zustände, einschließlich neurologischer Erkrankungen, Tumore und gebrochener oder gebrochener Knochen.

Selbstfahrende Autos

Autonome Fahrzeuge müssen ihre Umgebung verstehen sicher zu fahren. Dies bedeutet, Straßen, Fahrspuren, Ampeln, andere Fahrzeuge, Fußgänger und mehr zu erkennen. Alle diese Aufgaben nutzen Computer-Vision-Systeme in Echtzeit, um Kollisionen zu vermeiden und sicher zu fahren.

Computer Vision ist eine Herausforderung

Die aktuellen Anwendungen von Computer Vision beginnen bereits, die Art und Weise, wie wir in verschiedenen Branchen arbeiten, zu verändern. Von der Erkennung fehlerhafter oder defekter Geräte bis hin zur genauen Diagnose von Krebs kann Computer Vision Systeme verbessern und Leben retten.

Aber es ist nicht ohne Herausforderungen. Computer Vision ist noch weit davon entfernt, was menschliches Sehen ist Wir haben Tausende von Jahren Evolution, die es uns ermöglicht, fast alles, was um uns herum passiert, in Echtzeit zu erkennen und zu verstehen. Aber wir haben keine Ahnung, wie das menschliche Gehirn diese Aufgaben erfüllt.

Deep Learning ist ein gewaltiger Schritt in die richtige Richtung, erfordert aber dennoch erstaunlich viel Arbeit ein System zu entwickeln, das eine Aufgabe ausführen kann, die Menschen sehr einfach ausführen können, wie z Straße. Dies liegt daran, dass Computer eingeschränkte Aufgaben sehr effektiv ausführen. Einen Computer zu entwickeln, der die gesamte Komplexität der visuellen Welt verstehen kann, ist ein ganz anderes Ballspiel.

Da sowohl in KI-Anwendungen als auch in der Humanbiologie mehr geforscht wird, werden wir in naher Zukunft wahrscheinlich eine Explosion der Anwendungsmöglichkeiten für Computer Vision erleben.

Email
Was sind maschinelle Lernalgorithmen? So funktionieren sie

Algorithmen des maschinellen Lernens sollen das Leben erleichtern und Systeme verbessern, aber sie können mit schlimmen Folgen schiefgehen.

Weiter lesen

Verwandte Themen
  • Technologie erklärt
  • Programmierung
  • Künstliche Intelligenz
  • Neuronale Netze
Über den Autor
Jake Harfield (16 Artikel veröffentlicht)

Jake Harfield ist ein freiberuflicher Autor mit Sitz in Perth, Australien. Wenn er nicht gerade schreibt, ist er normalerweise draußen im Busch und fotografiert die einheimische Tierwelt. Sie können ihn unter www.jakeharfield.com besuchen

Mehr von Jake Harfield

Abonnieren Sie unseren Newsletter

Abonnieren Sie unseren Newsletter für technische Tipps, Rezensionen, kostenlose E-Books und exklusive Angebote!

Noch ein Schritt…!

Bitte bestätigen Sie Ihre E-Mail-Adresse in der E-Mail, die wir Ihnen gerade gesendet haben.

.