Chcąc uprościć wdrażanie wizji komputerowej, Google zaprezentował swoje rozwiązanie no-code, Vertex AI Vision. Platforma wypełnia lukę między źródłami strumieni wideo, modelami uczenia maszynowego i hurtowniami danych, umożliwiając użytkownikom wydobywanie cennych spostrzeżeń bez konieczności stosowania skomplikowanych inżynierii.
Tworzenie aplikacji wizyjnych AI było w przeszłości zarówno trudne, jak i kosztowne, a organizacje potrzebowały analityków danych i inżynierów uczenia maszynowego do tworzenia potoków szkoleniowych i wnioskowania na podstawie nieustrukturyzowanych danych, takich jak obrazy i filmy. Niedobór wykwalifikowanych specjalistów w tej dziedzinie doprowadził do jeszcze wyższych wydatków dla przedsiębiorstw.
Jednak firmy takie jak Google, Intel, Meta, Microsoft, NVIDIA i OpenAI zaczęły udostępniać publicznie wstępnie wyszkolone modele sztucznej inteligencji. Modele te, w tym wykrywanie twarzy, wykrywanie emocji, wykrywanie pozy i wykrywanie pojazdów, umożliwiają programistom tworzenie zaawansowanych aplikacji wizyjnych. Praktyczne zastosowania mogą się różnić, od wykorzystania istniejących kamer CCTV i IP do celów bezpieczeństwa po wykorzystanie uczenia maszynowego na podstawie wstępnie wyszkolonych modeli. Wyzwaniem pozostaje usprawnienie złożonych procesów wymaganych do połączenia tych odmiennych elementów.
Dostrzegając tę możliwość, platformy takie jak Vertex AI Vision eliminują złożoność dzięki łatwym w użyciu narzędziom no-code, które łączą źródła wideo, modele i silniki analityczne. To nie tylko maksymalizuje wydajność, ale otwiera drzwi do przyspieszonego wdrażania wizji komputerowej opartej na sztucznej inteligencji w różnych branżach.
Vertex AI Vision firmy Google integruje wiele komponentów, aby zapewnić bezproblemową obsługę użytkownika, jednocześnie wydobywając wgląd w komputerową sztuczną inteligencję. Użytkownicy mogą pracować z wstępnie wytrenowanymi modelami w środowisku lub importować niestandardowe modele wyszkolone na platformie Vertex AI. Kluczem do Vertex AI Vision jest puste płótno, na którym użytkownicy wizualnie składają potok wnioskowania AI za pomocą elementów drag-and-drop. Dostępne złącza obsługują strumienie z kamer/wideo, szereg wstępnie wyszkolonych i specjalistycznych modeli, niestandardowe modele AutoML lub Vertex AI oraz opcje przechowywania danych, takie jak BigQuery i AI Vision Warehouse.
Kluczowe funkcje Vertex AI Vision obejmują:
- Vertex AI Vision Streams: usługa endpoint do pozyskiwania strumieni wideo i obrazów z rozproszonej geograficznie sieci. Google obsługuje skalowanie i przetwarzanie, umożliwiając łatwe łączenie urządzeń i kamer.
- Aplikacje Vertex AI Vision: rozbudowane, automatycznie skalowane potoki przetwarzania i analizy multimediów są tworzone przy użyciu tej bezserwerowej platformy orkiestracji.
- Modele wizyjne Vertex AI: Klienci mają dostęp do gotowych modeli wizyjnych do standardowych zadań analitycznych, takich jak zliczanie obecności, wykrywanie środków ochrony indywidualnej, rozmycie twarzy i rozpoznawanie produktów detalicznych. Użytkownicy mogą dodatkowo budować i wdrażać swoje modele wyszkolone w ramach platformy Vertex AI.
- Vertex AI Vision Warehouse: Łącząc możliwości wyszukiwania Google i zarządzanego przechowywania wideo, ten zintegrowany, bezserwerowy system przechowywania multimediów jest w stanie obsłużyć petabajty danych wideo.
Po wizualnym utworzeniu potoku wdrożenie jest proste. Zielone znaczniki wyboru pokazane podczas wdrażania oznaczają powodzenie. Po wdrożeniu Google oferuje narzędzie wiersza poleceń o nazwie vaictl do obsługi kanałów wideo i kieruje je do odpowiedniego endpoint Vertex AI Vision. Zarówno strumienie wejściowe, jak i wyjściowe mogą być monitorowane, a dzięki AI Vision Warehouse można je przeszukiwać na podstawie określonych kryteriów wyszukiwania.
Vertex AI Vision oferuje SDK do programowej komunikacji z hurtownią, podczas gdy istniejące biblioteki mogą być wykorzystywane przez programistów BigQuery do wykonywania zaawansowanych zapytań w oparciu o ANSI SQL. Aby umożliwić niestandardowe przetwarzanie, firma Google zintegrowała również Cloud Functions, aby manipulować danymi wyjściowymi i dodawać adnotacje lub dodatkowe metadane.
Vertex AI Vision firmy Google Cloud czyni znaczne postępy w upraszczaniu implementacji sztucznej inteligencji dzięki środowisku no-code i możliwościom integracji. Prawdziwa moc platformy wynika z jej bezproblemowej integracji z innymi niezbędnymi usługami Google Cloud, takimi jak BigQuery, Cloud Functions i Vertex AI. Aby w pełni uwolnić potencjał platformy, potrzebne jest większe wsparcie dla wdrożeń brzegowych. Branże takie jak opieka zdrowotna, ubezpieczenia i motoryzacja polegają na potokach sztucznej inteligencji na brzegu sieci w celu zmniejszenia opóźnień i spełnienia wymagań dotyczących zgodności. Rozszerzenie obsługi wdrożeń brzegowych będzie miało kluczowe znaczenie dla przyszłego sukcesu Vertex AI Vision.
Narzędzia No-code, takie jak Vertex AI Vision i platforma AppMaster, zwiększają dostępność i umożliwiają programistom na wszystkich poziomach umiejętności tworzenie innowacyjnych aplikacji. Dzięki platformom, takim jak AppMaster i Vertex AI Vision, wcześniej złożone procesy zostały usprawnione, zapewniając wydajne i skalowalne aplikacje dla wszystkich firm.