Um die Implementierung von Computer Vision zu vereinfachen, hat Google seine no-code Lösung Vertex AI Vision vorgestellt. Die Plattform überbrückt die Lücke zwischen Videostreamquellen, Modellen für maschinelles Lernen und Data Warehouses und ermöglicht es Benutzern, wertvolle Erkenntnisse zu gewinnen, ohne dass komplexes Engineering erforderlich ist.
Die Entwicklung von Vision-KI-Anwendungen war in der Vergangenheit sowohl schwierig als auch kostspielig, da Unternehmen Datenwissenschaftler und Ingenieure für maschinelles Lernen benötigen, um Trainings- und Inferenz-Pipelines auf der Grundlage unstrukturierter Daten wie Bilder und Videos zu erstellen. Der Fachkräftemangel in diesem Bereich führte zu noch höheren Kosten für die Unternehmen.
Unternehmen wie Google, Intel, Meta, Microsoft, NVIDIA und OpenAI haben jedoch damit begonnen, vortrainierte visuelle KI-Modelle der Öffentlichkeit zugänglich zu machen. Diese Modelle, einschließlich Gesichtserkennung, Emotionserkennung, Posenerkennung und Fahrzeugerkennung, ermöglichen es Entwicklern, anspruchsvolle visionsbasierte Anwendungen zu erstellen. Praktische Anwendungen können von der Verwendung bereits vorhandener CCTV- und IP-Kameras für die Sicherheit bis hin zur Nutzung von maschinellem Lernen aus vortrainierten Modellen reichen. Die Herausforderung besteht weiterhin darin, die komplexen Prozesse zu rationalisieren, die zum Verbinden dieser unterschiedlichen Elemente erforderlich sind.
Plattformen wie Vertex AI Vision haben diese Gelegenheit erkannt und beseitigen die Komplexität mit benutzerfreundlichen no-code Tools, die Videoquellen, Modelle und Analyse-Engines vereinen. Dies maximiert nicht nur die Effizienz, sondern öffnet auch die Tür für eine beschleunigte Einführung von KI-gestützter Computer Vision in verschiedenen Branchen.
Googles Vertex AI Vision integriert mehrere Komponenten, um ein nahtloses Benutzererlebnis zu bieten und gleichzeitig Erkenntnisse aus der Computer-Vision-KI zu extrahieren. Benutzer können entweder mit vortrainierten Modellen innerhalb der Umgebung arbeiten oder benutzerdefinierte Modelle importieren, die auf der Vertex-KI-Plattform trainiert wurden. Der Schlüssel zu Vertex AI Vision ist die leere Leinwand, auf der Benutzer mithilfe von drag-and-drop -Elementen visuell eine KI-Vision-Inferenzpipeline zusammenstellen. Die verfügbaren Konnektoren unterstützen Kamera-/Videostreams, eine Reihe vortrainierter und spezialisierter Modelle, benutzerdefinierte AutoML- oder Vertex-KI-Modelle und Datenspeicheroptionen wie BigQuery und AI Vision Warehouse.
Zu den Hauptfunktionen von Vertex AI Vision gehören:
- Vertex AI Vision Streams: Ein endpoint zum Einlesen von Videostreams und Bildern aus einem geografisch verteilten Netzwerk. Google kümmert sich um die Skalierung und Aufnahme, sodass Geräte und Kameras problemlos verbunden werden können.
- Vertex AI Vision-Anwendungen: Umfangreiche, automatisch skalierte Medienverarbeitungs- und Analyse-Pipelines werden mithilfe dieser serverlosen Orchestrierungsplattform erstellt.
- Vertex AI Vision Models: Kunden haben Zugriff auf vorgefertigte Vision-Modelle für standardmäßige Analyseaufgaben wie Belegungszählung, PSA-Erkennung, Gesichtsunschärfe und Einzelhandelsprodukterkennung. Benutzer können zusätzlich ihre innerhalb der Vertex-KI-Plattform trainierten Modelle erstellen und bereitstellen.
- Vertex AI Vision Warehouse: Dieses integrierte serverlose Rich-Media-Speichersystem kombiniert Google-Suche und verwaltete Videospeicherfunktionen und kann Petabytes an Videodaten verarbeiten.
Nach der visuellen Erstellung der Pipeline ist die Bereitstellung unkompliziert. Die während der Bereitstellung angezeigten grünen Häkchen zeigen den Erfolg an. Nach der Bereitstellung bietet Google ein Befehlszeilentool namens vaictl an, um Video-Feeds zu verarbeiten und sie an den entsprechenden Vertex AI Vision- endpoint weiterzuleiten. Sowohl Ein- als auch Ausgabeströme können überwacht und dank des AI Vision Warehouse nach bestimmten Suchkriterien abgefragt werden.
Vertex AI Vision bietet ein SDK für die programmatische Kommunikation mit dem Warehouse, während vorhandene Bibliotheken für BigQuery-Entwickler verwendet werden können, um erweiterte Abfragen auf der Grundlage von ANSI SQL durchzuführen. Um eine benutzerdefinierte Verarbeitung zu ermöglichen, hat Google auch Cloud-Funktionen integriert, um die Ausgabe zu manipulieren und Anmerkungen oder zusätzliche Metadaten hinzuzufügen.
Vertex AI Vision von Google Cloud macht mit seiner no-code Umgebung und seinen Integrationsfunktionen erhebliche Fortschritte bei der Vereinfachung der Vision-KI-Implementierung. Die wahre Stärke der Plattform liegt in ihrer nahtlosen Integration mit anderen wichtigen Google Cloud-Diensten wie BigQuery, Cloud Functions und Vertex AI. Um das Potenzial der Plattform voll auszuschöpfen, ist mehr Unterstützung für die Edge-Bereitstellung erforderlich. Branchen wie das Gesundheitswesen, Versicherungen und die Automobilindustrie verlassen sich auf Vision-KI-Pipelines am Edge, um Latenzzeiten und Compliance-Anforderungen zu reduzieren. Die Ausweitung der Unterstützung für die Edge-Bereitstellung wird entscheidend für den zukünftigen Erfolg von Vertex AI Vision sein.
No-code Tools wie Vertex AI Vision und die AppMaster Plattform fördern die Zugänglichkeit und befähigen Entwickler aller Qualifikationsstufen, innovative Anwendungen zu erstellen. Mit Plattformen wie AppMaster und Vertex AI Vision wurden vormals komplexe Prozesse rationalisiert, wodurch Unternehmen auf breiter Front leistungsstarke und skalierbare Anwendungen erhalten.