Computer Vision ist eine Wissenschaft in den Bereichen zwischen Informatik und den Ingenieurwissenschaften und ist ebenfalls ein Teilgebiet der künstlichen Intelligenz. Computerbasiertes Sehen bezeichnet Systeme, die Objekte in digitalem Stand- und Bewegtbildmaterial identifizieren und dementsprechend verarbeiten und reagieren können. Computer Vision kombiniert Kameras, Edge- oder Cloud-Computing, Software und künstliche Intelligenz (KI), um Systemen das „Sehen“ und Erkennen von Objekten in Datenform zu ermöglichen. Computer Vision liefert eine wichtige Grundlage für Outside-In Tracking.
Zu diesen Daten können Fotos, Scans, Videos oder auch multidimensionale Daten, wie zum Beispiel aus dem medizinischen Bereich zählen. In einigen Bereichen haben Maschinen mit Computer Vision sogar das menschliche Sehen und menschliche Leistungen übertroffen.
Gängige Aufgaben von Computerbasiertem Sehen sind die Erkennung von Objekten und Vermessung der Struktur von Dingen sowie von Bewegungen. Also die Grundlagen von AR/VR Anwendungen von Smartglasses bis zu Web-AR Anwendungen.
Die Geschichte von Computer Vision
Frühe Experimente fanden bereits in den 1950er Jahren statt. Die Experimente begannen 1959, als Neurophysiologen einer Katze mehrere Bilder zeigten und versuchten durch diese eine Reaktion in ihrem Gehirn zu ermitteln. Sie entdeckten, dass als erstes auf harte Kanten oder Linien reagierte, was wissenschaftlich gesehen bedeutet, dass die Bildverarbeitung mit einfachen Formen wie geraden Kanten beginnt. Das Herausstellen verschiedener Merkmale, wie Kanten und Ecken, war in den 1970er bis 1980er Jahren ein aktives Forschungsgebiet.
Mit der Entwicklung digitaler Kameras in den 1980er Jahren wurden immer mehr Programme getestet und entwickelt. Der Ausbau des Internets in den 1990er Jahren und die dadurch verfügbaren Bilder dort, die analysiert werden konnten, verhalfen der Gesichtserkennung zur Endentwicklung.
Das Feld der Computer Vision hat sich innerhalb der vergangenen zwanzig Jahre entscheidend weiterentwickelt: Heutige Computer-Vision-Systeme erreichen eine Genauigkeit von 99 Prozent und laufen inzwischen auch auf mobilen Geräten.
Wie funktioniert Computer Vision?
Die grundlegende Aufgabe des Computer Vision besteht darin, einer Kamera das Sehen und Verstehen beizubringen, die über eine Schnittstelle am Computer oder Endgerät angeschlossen ist.
Zunächst einmal benötigt der Computer ein aufgenommenes Bild. In diesem Bild muss eine Software dann Umrisse und Kanten erkennen können. Diesen ersten Schritt erledigt eine Programmierung, die Farbtöne und Kontraste analysiert und anpasst. Die Software kann so Kanten ausfindig machen und so Objekte erkennen und zuordnen.
Bei komplexeren Objekten werden oft zwei- oder dreidimensionale Modelle mit einbezogen.
Wenn ein Video analysiert wird, dann wird mit einer weiteren Gruppe von Methoden gearbeitet, um zu erkennen, ob das Objekt sich bewegt. Zu diesen Methoden gehört der sogenannte optische Fluss. Hierbei werden Bildpunkte einem Objekt zugeordnet und durch einen Vergleich der einzelnen Bilder kann schließlich bestimmt werden ob und in welche Richtung sich das Objekt bewegt.
In welchen Bereichen wird es angewendet?
Industrie und Ausbildung wendet die Techniken des Computer Vision in Kombination mit Spatial Computing heutzutage professionell und erfolgreich verwendet. Computer können Eigenschaften wie die Dichte von Beschichtungen messen, oder Produktionsfehler können frühzeitig erkennen und beseitigen. In vielen Industriebetrieben ist eine Qualitätssicherung mithilfe von automatisierter, optischer Inspektion bereits Standard. Hierbei entscheidet ein Computer auf Grundlage von Kameraaufnahmen und -bildern, ob etwas den Qualitätsstandards entspricht, oder nicht.
Besonders beim Autonomen Fahren werden hohe Anforderungen an Computer Vision gestellt, da selbstfahrende Autos Hindernisse erkennen und auf Gefahren reagieren müssen. Hier ist eine hohe Verarbeitungsgeschwindigkeit nötig. Gleiches gilt für Roboter, Drohnen und weitere autonome mobile Geräte.
Doch auch im täglichen Leben findet jeder Computer Vision wieder, beispielsweise in der Maßband-App auf dem Smartphone, die ein Objekt erkennt und seine Dimensionen erfassen kann.
Auch die Einzelhandels-Branche erprobt und nutzt bereits Computer Vision. In „Go Stores“ erkennt ein Computer, wenn ein Kunde ein Produkt aus dem Regal nimmt oder zurücklegt. Das mit der Computer Vision verbundene Kassensystem rechnet den Einkauf automatisch über das Smartphone des Kunden ab.
Verschiedene Computer Vision-Typen
Durch die vielseitigen, verschiedenen Einsatzmöglichkeiten von Computer Vision, gibt es auch verschiedene Typen des maschinellen Sehens, die unterschiedlich zur Anwendung kommen können.
Es beginnt mit der Bildsegmentierung. Hierbei unterteilt die Software ein Bild in mehrere Bereiche, trennt es und untersucht es anschließend. In der Medizin unterstützt Computer Vision so die Detektion von krankem Gewebe in Röntgen- oder CT-Aufnahmen.
Die Objekterkennung dient zur Identifikation eines bestimmten Objekts innerhalb eines Bildes. Diese Modelle erstellen mit Hilfe einer X-Y-Koordinate ein Begrenzungsfeld und identifizieren alles innerhalb des markierten Feldes.
Automatische Gesichtserkennung
Eine weiterentwickelte Form der Objekterkennung ist die Gesichtserkennung. Mit dieser erkennen Kameras nicht nur Gesichter, sondern können – mit einer nicht zu unterschätzenden Fehlerquote – sogar Menschen identifizieren. Besonders da, wo Polizei und Ordnungskräfte Multikamera-Netzwerke verwenden, wie beispielsweise zur Überwachung und Kontrolle von Verkehrsknotenpunkten, dem öffentlichen Nahverkehr oder Flughäfen, kann diese Technologie einen großen Nutzen bieten. So helfen beispielsweise Algorithmen bei der frühzeitigen Erkennung von Gefahrensituationen oder bei der Erkennung von Personen innerhalb des Netzwerkes. Die Polizei benutzt das System auch bei Fahndungen.
Die Bildklassifikation dient zur Einordnung und Gruppierung von Bildern in gewisse Kategorien. Dabei können auch mehrere unterschiedliche Objekte oder Personen in einem Bild erkannt und gruppiert werden.
Die Bewegungsanalyse ist eine weitere Aufgabe des Computer Vision. Hierbei kommt dessen Teilgebiet, die Egomotion zum Einsatz. Diese schätzt die Kamerabewegung relativ zur dreidimensionalen Umgebung ab. Dies ist beispielsweise bei autonom fahrenden Autos entscheidend. Die semantische Aufschlüsselung in 3D-Daten ermöglicht es, zusammenhängende Strukturen zu erkennen, zuzuordnen und zusammenzusetzen.
Ein bestimmtes Problem im Bereich der Bildverarbeitung kann leicht mit einer zugeschnittenen statistischen Methode gelöst werden, während ein anderes Problem eine große und komplizierte Einheit von allgemeinen maschinellen Lernalgorithmen benötigt.
Einfachen Anwendungen, die Computer Vision nutzen, arbeiten in der Regel nur mit einem der Verfahren. In hochentwickelten Bereichen, wie beispielsweise autonom fahrenden Autos werden mehrere oder alle Verfahren kombiniert, um das bestmögliche Ergebnis zu erhalten.
Computer können immer besser sehen
Durch ständige Forschung und Weiterentwicklung wird Computer Vision immer präziser und zuverlässiger. Jetzt bereits kann Computer Vision es in zahlreichen Fällen mit dem menschlichen Hirn aufnehmen.
Verbesserte Algorithmen und neue Technologien wie ein Rundum-Blick um das autonom fahrende Fahrzeug oder eine mehrgipflige Sensordatenfusion lassen sich bereits heute in Unterstützungssysteme einbinden, um die KI und den Menschen zu unterstützen.
Durch die Möglichkeit des Transfer Learning können mittlerweile auch Anfänger und Laien Computer Vision zum Einsatz bringen und auch ebenfalls durch die Weiterentwicklung von Frameworks und Modellen.
Die Kombination aus maschinellem Sehen und maschinellem Lernen ermöglicht es Unternehmen, intelligentere Techniken einzuführen, die ihnen die Genauigkeit, Effizienz und das materielle Wachstum der Zukunft ermöglichen.
Bildnachweis: ©Sergey Nivens – stock.adobe.com
Du interessierst dich für die Entwicklung einer VR oder AR Applikation? Du hast vielleicht schon eine konkrete Idee oder bist noch auf der Suche nach Inspiration? Mache heute den ersten Schritt und erhalte Antworten auf deine Fragen:
Unsere VR-Experten helfen dir gerne bei einer unverbindlichen Einschätzung deines Projekts! Erfahre jetzt alles was du wissen musst, um deine Firma oder Organisation in die Welt der virtuellen und erweiterten Realität zu führen. Es lohnt sich!
Du interessierst dich für die Entwicklung einer VR oder AR Applikation? Du hast vielleicht schon eine konkrete Idee oder bist noch auf der Suche nach Inspiration? Mache heute den ersten Schritt und erhalte Antworten auf deine Fragen:
Unsere VR-Experten helfen dir gerne bei einer unverbindlichen Einschätzung deines Projekts! Erfahre jetzt alles was du wissen musst, um deine Firma oder Organisation in die Welt der virtuellen und erweiterten Realität zu führen. Es lohnt sich!