Computer Vision ermöglicht durch die algorithmische Verarbeitung digitaler Bilder die kontaktlose Analyse des Bild-Inhalts. Objekte können detektiert, klassifiziert, verfolgt und durch Photogrammetrie vermessen werden. Hierbei können nicht nur gewöhnliche Farbbilder von RGB-Kameras verwendet werden, sondern jedes Bildgebende Verfahren – z.B. auch Röntgen oder spektrale Aufnahmen.
Die Vorteile liegen auf der Hand – mit Hilfe von Computer Vision und Künstlicher Intellenz/Machine Learning können eine Vielzahl von Aufgaben die bisher manuell durchgeführt werden mussten nun automatisiert werden, einhergehend mit gesteigerter Qualität und höherem Durchsatz.
Einsatzmöglichkeiten
Detektion
Ein oder mehrere Objekte können in einem einzigen Bild aufgrund ihres Aussehens und ihrer abgebildeten Merkmale erkannt werden.
Klassifikation
Erkannte Objekte können auf Basis der festgestellten Merkmale einer von vielen Klassen zugeordnet werden,
es können Abweichungen der Norm erkannt werden.
Tracking
Durch die Analyse von Videos können Objekte verfolgt werden und so gezählt, deren Geschwindigkeit ermittelt, oder anomale/stockende Bewegungen erkannt werden.
Vermessung
Objekte können genau vermessen werden – sowohl die physischen Dimensionen, als auch deren Form , Farbe und eventuelle Defekte können Millimeter-genau vermessen werden.
Vorgehen
Mit Hilfe des DTQ-Vision-Toolkits helfen wir Ihnen, Zeit- und Kosteneffektiv eine Lösung für Ihre Computer Vision Herausforderung zu finden, zu evaluieren, und letztendlich produktiv zu implementieren. Trotz der fast unerschöpflichen Möglichkeiten von Anwendungsgebieten und Lösungsansätzen folgen wir hierbei einem bewährten Vorgehensmodell:
Anforderungs-Analyse
In einer Anforderungs-Analyse erarbeiten und dokumentieren wir die Ziele, Voraussetzungen und Rahmenbedingungen mit Ihnen. Anschließend planen wir eine Fallstudie, an deren Ende ein funktionsfähiger Prototyp steht.
Prototyp
Dieser Prototyp liefert Erkenntnisse und belastbare Zahlen über die Qualität des angedachten Verfahrens.
Während diese Phase werden folgende Schritte durchlaufen:
> Erhebung repräsentativer Daten und deren Annotation (Ground-Truth)
> Auswahl, Training und Evaluation eines oder mehrerer geeigneter Algorithmen
Implementierung
Wenn Sie mit den Ergenissen zufrieden sind, implementieren wir die Verfahren in produktiv einsetzbaren Programmen und helfen bei der Integration in eventuell bestehende Prozesse und Infrastrukturen
Betrieb
Natürlich begleiten wir Sie – falls gewünscht – auch in der produktiven Phase beim Monitoring, der Weiterentwicklungen oder eventuell gewünschten Änderungen
Auswahl bisheriger Computer Vision Projekte
Hier finden Sie eine kleine Auswahl bisheriger Projekte verschiedener Anwendungsbereiche und Problemstellungen.
Es wurden bereits eine Vielzahl von Projekten erfolgreich umgesetzt – sowohl von statischen Kameras in industriellen Settings, als auch von bewegten Kameras, die in Kraftfahrzeugen oder an Drohnen montiert sind.
Es wurden im Vorfeld repräsentative Videos aufgezeichnet und die interessanten Objekte wurden manuell annotiert (im Video werden die Konturen und Klassen der interessanten Objekte über deren Verlauf im Video markiert). Mit Hilfe dieser Daten wurden tiefe neuronale Netze trainiert, welche die Objekte dann in Live-Aufnahmen zuverlässig erkennen können.
Je nach Anwendungsfall kommt ein auf das Problem zugeschnittener Tracking-Algorithmus zum Einsatz, der auf die dynamischen Gegebenheiten des jeweiligen Anwendungsfalles angepasst ist. So lassen sich z.B. im Straßenverkehr Autos und Fußgänger erkennen, im industriellen Setting können produzierte Güter auf dem Fließband erkannt, verfolgt, gezählt und auf Defekte analyisiert werden, es können freie Parkplätze in einem Areal erkannt werden – so lange man einen Sachverhalt in einem Bild/Video erkennen kann, kann die Aufgabe durch unser DTQ-Vision-Toolkit automatisiert werden!
In diesem Anwendungsfall laufen unsortiere Muttern, Schrauben und Abstandshalter über ein Fließband und sollen erkannt, klassifiziert und gezählt werden.
Aufgrund der konstanten Gegebenheiten (Kamera-Position, Licht, Hintergrund, zu erwartende Objekte) wurde hier ein modell-basiertes Verfahren verwendet. Hier können alle Variablen mathematisch/physikalisch modelliert werden, und auf Basis dessen geeignete Klassifikations-Methoden implementiert werden. Diese Herangehensweise ist häufig um ein Vielfaches schneller als tiefe neuronale Netze und benötigen dementsprechend weniger Hardware-Ressourcen.
Die Objekte können vor dem uniformen Hintergrund gut erkannt und segmentiert werden. Da der Abstand der Kamera zum Fließband, sowie die Kalibrierung der Kamera bekannt ist, können die Objekte photogrammetrisch vermessen und klassifiziert werden. Die konstante Geschwindigkeit des Fließbandes erleichtert das Tracking.
Das Verfahren wurde in Python auf Basis unseres DTQ-Vision-Toolkits implementiert und läuft auf einem handelsüblichen Raspberry Pi.
Zitronen
Bei der Ernte und Lagerung von organischen Lebensmitteln können Beschädigungen, ungewünschte Stiele, Schimmel oder Krankheiten auftreten. Einige dieser Beeinträchtigungen verhindern einen Verkauf oder können sogar eine ganze Charge gefähren.
Die manuelle Inspektion und Sortierung ist sehr Zeit- und Arbeits-aufwendig, weshalb eine automatische Klassifikation viele Vorteile bringt.
In dieser Fallstudie wurden eine Vielzahl von Bildern von Zitronen verschiedener Qualitäts-Stufen und mit verschiedenen der genannten Beeinträchtigungen in Farbbildern aufgenommen und annotiert. Die Bilder wurden durch das DTQ-Vision-Toolkit (vor-)verabeitet und mithilfe eines tiefen neuronalen Netzes können nun Defekte erkannt und markiert werden.
Das tiefe neuronale Netz basiert auf der Mask-RCNN-Struktur und wurde in Pytorch implementiert.
Technologien und Voraussetzungen für Firmen
Grundvoraussetzung ist eine gute Idee und Vorstellung, welche Herausforderung gelöst werden soll.
Prinzipiell lässt sich sich jedes Problem, das mit Computer Vision vorstellbar ist auch implementieren –
sehr gern unterstützen wir Sie auch schon in dieser Phase.
Bei der Hardware-Auswahl und -Installation muss vieles beachtet werden: Bietet die ausgewählte Kamera eine ausreichende Auflösung und Bildwiederholrate sowie Lichtempfindlichkeit, ist die Beleuchtung am angedachten Einsatzort optimal eingestellt, welche Leistungskennzahlen braucht der Computer? Dies ist je nach Anwendungsfall verschieden, aber mit unserer langjährigen Expertise können wir Sie gut und sicher beraten.
Bei der Aufnahme und Auswahl repräsentativer Bilder/Videos kommt es darauf an, den späteren Anwendungsfall so genau wie möglich nachzubilden und alle nötigen Variablen zu beachten – falls ein Machine-Learning Algorithmus eingesetzt werden soll ist das sogar essenziell.
Auch beim Annotieren der Daten gibt es einige Fallstricke – wir haben langjährige Partner, die zuverlässig hochqualitative und kostengünstige Annotationen in kürzester Zeit erstellen.