컴퓨터 비전 구현을 단순화하기 위한 움직임으로 Google은 no-code 솔루션인 Vertex AI Vision을 공개했습니다. 이 플랫폼은 비디오 스트림 소스, 기계 학습 모델 및 데이터 웨어하우스 사이의 격차를 해소하여 사용자가 복잡한 엔지니어링 없이 귀중한 통찰력을 추출할 수 있도록 합니다.
비전 AI 애플리케이션을 개발하는 것은 역사적으로 어렵고 비용이 많이 들었습니다. 조직에는 이미지 및 비디오와 같은 구조화되지 않은 데이터를 기반으로 교육 및 추론 파이프라인을 생성하기 위해 데이터 과학자와 머신 러닝 엔지니어가 필요했습니다. 이 분야의 숙련된 전문가가 부족하여 기업에 더 많은 비용이 소요되었습니다.
그러나 Google, Intel, Meta, Microsoft, NVIDIA 및 OpenAI와 같은 회사는 사전 훈련된 비전 AI 모델을 대중에게 제공하기 시작했습니다. 얼굴 감지, 감정 감지, 자세 감지, 차량 감지를 비롯한 이러한 모델을 통해 개발자는 정교한 비전 기반 애플리케이션을 구축할 수 있습니다. 실용적인 애플리케이션은 보안을 위해 기존 CCTV 및 IP 카메라를 사용하는 것부터 사전 학습된 모델에서 머신 러닝을 활용하는 것까지 다양할 수 있습니다. 이러한 서로 다른 요소를 연결하는 데 필요한 복잡한 프로세스를 간소화하는 것이 과제입니다.
이 기회를 인식한 Vertex AI Vision과 같은 플랫폼은 비디오 소스, 모델 및 분석 엔진을 통합하는 사용하기 쉬운 no-code 도구로 복잡성을 제거합니다. 이는 효율성을 극대화할 뿐만 아니라 다양한 산업 분야에서 AI 기반 컴퓨터 비전을 가속화할 수 있는 문을 열어줍니다.
Google의 Vertex AI Vision은 컴퓨터 비전 AI 인사이트를 추출하면서 원활한 사용자 경험을 제공하기 위해 여러 구성 요소를 통합합니다. 사용자는 환경 내에서 선행 학습된 모델로 작업하거나 Vertex AI 플랫폼에서 학습된 커스텀 모델을 가져올 수 있습니다. Vertex AI Vision의 핵심은 사용자가 drag-and-drop 요소를 사용하여 AI 비전 추론 파이프라인을 시각적으로 조립하는 빈 캔버스입니다. 사용 가능한 커넥터는 카메라/비디오 스트림, 다양한 사전 교육 및 특수 모델, 맞춤형 AutoML 또는 Vertex AI 모델, BigQuery 및 AI Vision Warehouse와 같은 데이터 스토리지 옵션을 지원합니다.
Vertex AI Vision의 주요 기능은 다음과 같습니다.
- Vertex AI Vision Streams: 지리적으로 분산된 네트워크에서 비디오 스트림 및 이미지를 수집하기 위한 endpoint 서비스입니다. Google에서 확장 및 수집을 처리하여 기기와 카메라를 쉽게 연결할 수 있습니다.
- Vertex AI Vision 애플리케이션: 이 서버리스 오케스트레이션 플랫폼을 사용하여 광범위한 자동 확장 미디어 처리 및 분석 파이프라인을 구축합니다.
- Vertex AI 비전 모델: 고객은 점유 계수, PPE 감지, 얼굴 흐림, 소매 제품 인식과 같은 표준 분석 작업을 위해 사전 구축된 비전 모델에 액세스할 수 있습니다. 사용자는 Vertex AI 플랫폼 내에서 학습된 모델을 추가로 구축하고 배포할 수 있습니다.
- Vertex AI Vision Warehouse: Google 검색 및 관리형 비디오 스토리지 기능을 결합한 이 통합 서버리스 리치 미디어 스토리지 시스템은 페타바이트의 비디오 데이터를 처리할 수 있습니다.
파이프라인의 시각적 생성 후 배포는 간단합니다. 배포 중에 표시되는 녹색 눈금 표시는 성공을 나타냅니다. 배포 후 Google은 vaictl이라는 명령줄 도구를 제공하여 동영상 피드를 처리하고 적절한 Vertex AI Vision endpoint 로 안내합니다. 입력 및 출력 스트림을 모두 모니터링할 수 있으며 AI Vision Warehouse로 인해 특정 검색 기준에 따라 쿼리할 수 있습니다.
Vertex AI Vision은 웨어하우스와의 프로그래밍 방식 통신을 위한 SDK를 제공하며 BigQuery 개발자는 기존 라이브러리를 사용하여 ANSI SQL을 기반으로 고급 쿼리를 수행할 수 있습니다. 맞춤 처리를 허용하기 위해 Google은 Cloud Functions를 통합하여 출력을 조작하고 주석 또는 추가 메타데이터를 추가했습니다.
Google Cloud의 Vertex AI Vision은 no-code 환경과 통합 기능으로 비전 AI 구현을 단순화하는 데 상당한 진전을 이루었습니다. 플랫폼의 진정한 힘은 BigQuery, Cloud Functions, Vertex AI와 같은 다른 필수 Google Cloud 서비스와의 원활한 통합에서 비롯됩니다. 플랫폼의 잠재력을 완전히 활용하려면 에지 배포에 더 많은 지원이 필요합니다. 의료, 보험 및 자동차와 같은 산업은 대기 시간 및 규정 준수 요구 사항을 줄이기 위해 에지에서 비전 AI 파이프라인에 의존합니다. 에지 배포에 대한 지원 확대는 Vertex AI Vision의 미래 성공에 매우 중요합니다.
Vertex AI Vision 및 AppMaster Platform 과 같은 No-code 도구는 접근성을 높이고 모든 기술 수준의 개발자가 혁신적인 애플리케이션을 만들 수 있도록 지원합니다. AppMaster 및 Vertex AI Vision과 같은 플랫폼을 사용하면 이전의 복잡한 프로세스가 간소화되어 고성능의 확장 가능한 애플리케이션을 기업 전반에 제공할 수 있습니다.