Weißt Du, was Computer Vision ist?

Bestimmt bin ich gemeint.

Mir ist der Begriff noch nie zuvor begegnet, und dennoch brüllt eine kleine innere Stimme in mir „Ich bin mir sicher, dass damit sehende Computer gemeint sind“. Ob die kleine Stimme in mir recht hat, werden wir heute dank der Autoren

Collin Croome, Christian Gleich: Praxisbuch Metaverse. Nutzen Sie die Internet-Revolution für Ihr Unternehmen

herausfinden. Die beiden berufen sich in ihrem Buch auf eine Studie von Gardner, die sich mit der Frage beschäftigt, wie die Zukunft des Metaverse aussehen könnte.

Das Metaverse ist eine Digitale Welt, die wir mit Hilfe einer Virtual Reality Brille betreten können. Mit Hilfe dieser Brille können wir zum Beispiel simulieren, dass wir uns jetzt in diesem Moment auf dem Gipfel der Zugspitze befinden. Dank der Brille sehen wir unter unseren Füßen den Berg, über uns den Himmel und um uns herum den fantastischen Ausblick, den wir sonst nur erhalten würden, wenn wir uns tatsächlich auf dem Gipfel der Zugspitze befinden würden.

Obwohl die Technologie für das Metaverse noch in den Kinderschuhen steckt, entwickelt es sich rasant. Ich habe keine Ahnung, ob das Metaverse jemals so funktionieren wird wie in den Spielfilmen „Matrix“ oder „Avatar“. Fest steht auf jeden Fall, dass beide Film-Versionen in der aktuellen Version des Metaverse nicht möglich sind. Die von unseren Autoren erwähnte englischsprachige Studie geht davon aus, dass es

  • bis 2024 das aufstrebende (Emerging) Metaverse geben wird, das dank ständig sinkender Hard- und Softwarekosten immer mehr Unternehmen dazu verleiten wird, sich mit dem Metaverse zu beschäftigen,
  • von 2024 bis 2027 das fortgeschrittene (Advanced) Metaverse geben wird, das dank immer kleinerer Hardware und interessanter Inhalte eine breite Zielgruppe erreichen wird,
  • ab 2028 das ausgereifte (Mature) Metaverse geben wird, das dank Technologien wie
    • künstlicher Intelligenz
    • Computer Vision
    • immersiver Technologien
    • digitaler Währungen

so einfach und klar zu verstehen sein wird, dass praktisch jeder es kennt und damit umgehen kann.

Hallo liebes Internet, wie genau funktioniert das?

Dank unserer Autoren wissen wir, dass Computer Vision eine wichtige Technologie für das ausgereifte Metaverse ist. Wie genau diese Technologie funktioniert, werden wir nun hoffentlich mit Hilfe der Studie herausfinden, die unsere Autoren in ihrem Buch nicht nur erwähnen, sondern auch verlinken.

Was steckt laut der Gardner-Studie hinter der Computer Vision?

Zu meiner großen Verwunderung verrät uns die Gardner-Studie nichts über den Begriff. Sie erwähnt ihn lediglich:

„Advances will build on inspirational use cases and applications discovered in phase 2 and reinforced by the maturation of adjacent technologies (such as 5G, computer vision, immersive tech and digital currencies).“

Quelle: https://www.gartner.com/en/articles/metaverse-evolution-will-be-phased-here-s-what-it-means-for-tech-product-strategy

Da wir die Antwort auf unsere heutige Frage nicht in der Studie gefunden haben, werden wir uns nun mit unserer Frage an das allwissende Internet wenden.

Was das Internet sagt

Dieses englischsprachige YouTube Video gibt meiner kleinen inneren Stimme recht. Bei Computer Vision geht es um sehende Computer. Computer, Tablets und Smartphones verfügen schon seit vielen Jahren über Kameras, mit denen Fotos und Videos aufgenommen werden können.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Was den Geräten fehlt, ist die Fähigkeit zu sehen wie ein Mensch. Inzwischen gibt es Programme wie die Google Cloud Vision API, die in der Lage ist, Objekte auf Bildern zu erkennen. Ich habe mir ein Bild mit einer Pusteblume aus meiner Sammlung geschnappt und dies auf der Seite der Google Cloud Vision API hochgeladen. Die Software war sich zu 92% sicher, dass auf dem Bild eine Blume zu sehen ist. Dass hier eine Pusteblume zu sehen ist, erkannte die Software mit einer Sicherheit von 75%.

Obwohl ich ein Stadtkind bin und wenig Ahnung von Natur habe, bin ich mir zu 100% sicher, dass auf dem Bild eine Pusteblume zu sehen ist. Das bedeutet, noch kann die Software mir beim Erkennen einer Pusteblume nicht das Wasser reichen. Sie kann in diesem Fall also noch nicht wie ein Mensch sehen. Dennoch bin ich überrascht, dass die Software eine Pusteblume erkennt und frage mich, wie sie das macht.

Wie funktioniert Computer Vision

Ein Video, dass fast alle Fragen beantwortet.

Zu meiner großen Freude erklärt das bereits erwähnte YouTube Video verschiedene Technologien, wie Computer es schaffen, Dinge auf Fotos oder in Videos zu erkennen

  1. Farbentracking (Color Marker Tracking): Wir bitten die Software darum, eine bestimmte Farbe – zum Beispiel die eines Fußballs in einem Video – ausfindig zu machen. Auf diese Weise ist ein Computer in der Lage, die Bewegungen eines Balls in einem Fußballspiel zu verfolgen. Allerdings funktioniert das nur, wenn die Spielertrikots nicht die gleiche Farbe wie der Ball haben.
  2. Pixelbereiche (Pixel Pattern Kernels): Mit Hilfe dieser Abfrage können wir dafür sorgen, dass die Software Flächen, wie zum Beispiel Metallpfeiler erkennt. Dies kann genutzt werden, um selbststeuernde Drohnen davor zu bewahren, in ein Objekt zu fliegen.
  3. Randbereiche (Edge Kernel): Mit Hilfe dieser Abfrage kann die Software Formen wie einen Ball oder Quadrat und sogar Linien erkennen. Da das menschliche Auge bei fast allen Menschen eine ähnliche Form hat, ist die Software dank der Randbereichserkennung in der Lage, menschliche Augen auf einem Bild zu erkennen.
  4. Deep Learning bzw. Convolutional Neural Networks: Bei allen bisher genannten Möglichkeiten bittet ein Mensch die Software, eine bestimmte Farbe oder ein bestimmtes Muster zu erkennen. Beim Convolutional Neural Network entwickelt die Software, soweit ich es verstanden habe, eigene Muster, mit deren Hilfe sie Bildinhalte erkennt. Aber am besten schaust Du das YouTube Video, um zu verstehen, wie genau die Sache mit den Neuronalen Netzwerken in Bezug auf Computer Vision funktioniert. Dank dieser Technologie ist die Software in der Lage, Dinge wie menschliche Gesichter und Pusteblumen zu erkennen.
  5. Algorithmen, die Emotionen verstehen (Emotion Recognition Algorithmen): Sobald ein menschliches Gesicht erkannt wurde, können spezielle Gesichtserkennungsalgorithmen eingesetzt werden, die anhand der Augenbrauenposition, der Größe der Augen und der Form des Mundes in der Lage sind, menschliche Emotionen zu erkennen.
  6. Biometrische Daten (Biometric Data): Die Software ist in der Lage, die Höhe unserer Stirn, die Größe unserer Nase und andere Gesichtsdetails zu erkennen. Dank dieser Fähigkeit können wir Smartphones und Computer heute allein mit unserem Gesicht entsperren.

Fazit

Wir wissen nun nicht nur was Computer Vision ist, wir wissen jetzt sogar, wie Computer in der Lage sind, Dinge auf Bildern zu identifizieren. Die einzige Frage, die mir zu diesem Thema nun noch unter den Nägeln brennt, ist die Frage, was Computern noch fehlt, um wie ein Mensch sehen zu können. Leider reicht heute meine Zeit nicht mehr, um dieser Frage nachzugehen. Doch wer weiß, vielleicht kommt irgendwann der Tag, an dem wir die Zeit finden, uns auch mit dieser Frage auseinanderzusetzen.

31. Januar 2024
Lesedauer & Kategorie
Schnellnavigation
Buchcover zum Beitrag
Buchcover Collin Croome, Christian Gleich Praxisbuch Metaverse. Nutzen Sie die Internet-Revolution für Ihr Unternehmen
Werbung

Das Buch, das diesen Beitrag inspiriert hat, habe ich als Rezensionsexemplar vom Verlag erhalten. Das bedeutet, ich habe das Buch kostenlos zur Verfügung gestellt bekommen, um darüber zu schreiben.

Schlagwörter
Autor
5,8 min readCategories: Bücher, Wissen

Schnellnavigation

Buchcover zum Beitrag

Buchcover Collin Croome, Christian Gleich Praxisbuch Metaverse. Nutzen Sie die Internet-Revolution für Ihr Unternehmen

Schlagwörter

Datum & Autor

31. Januar 2024
Weißt Du, was eine Robinsonade ist?
Weißt Du, was enigmatisch bedeutet?

Kommentiere den Beitrag

  1. Holger Fischer 31. Januar 2024 at 16:42 - Reply

    Simulieren lässt sich viel. Wer weiß, vielleicht auch die Realität? Nick Bostrom hat die Hypothese aufgestellt, dass wir uns in einer Simulation befinden. Diese Hypothese basiert auf dem Roman Simulacron-3 von Daniel F. Galouye aus dem Jahr 1964. Erstmals wurde dieser Roman 1973 mit dem Zweiteiler Welt am Draht verfilmt. Allerdings gibt es auch Platons Höhlengleichnis und die lebensecht WIRKENDEN Figuren des Dädalos ->

    https://info-allerlei.de/welt-am-draht.html

Was passiert nach Deinem Kommentar?

Nachdem Dein Kommentar durch uns geprüft wurde, wird er freigegeben* und erscheint unter diesem Beitrag zusammen mit dem von Dir angegebenen Namen. Deine E-Mail-Adresse wird nicht veröffentlicht. Sie dient uns an dieser Stelle in erster Linie zum Schutz vor Spam. Wenn Du Deine E-Mail-Adresse nicht hier angeben möchtest, kannst Du den Kommentar auch gern auf einem unserer Social Media Profile posten.

 

*Spam und Kommentare, die nur einen Backlink für die eigene Seite zum Ziel haben, werden einfach gelöscht. Nimm gern Kontakt mit uns auf und lass uns die Möglichkeiten eines Sponsored Post besprechen, wenn Du gern einen thematisch passenden Backlink unter einem bestimmten Beitrag platzieren möchtest.