Em um movimento para simplificar a implementação da visão computacional, o Google revelou sua solução no-code, Vertex AI Vision. A plataforma preenche a lacuna entre fontes de transmissão de vídeo, modelos de aprendizado de máquina e data warehouses, permitindo que os usuários extraiam informações valiosas sem a necessidade de engenharia complexa.
O desenvolvimento de aplicativos de IA de visão tem sido historicamente difícil e caro, com as organizações precisando de cientistas de dados e engenheiros de aprendizado de máquina para criar pipelines de treinamento e inferência com base em dados não estruturados, como imagens e vídeos. A escassez de especialistas qualificados nesta área levou a despesas ainda maiores para as empresas.
No entanto, empresas como Google, Intel, Meta, Microsoft, NVIDIA e OpenAI começaram a tornar modelos de IA de visão pré-treinados acessíveis ao público. Esses modelos, incluindo detecção de face, detecção de emoção, detecção de pose e detecção de veículo, permitem que os desenvolvedores criem aplicativos sofisticados baseados em visão. As aplicações práticas podem variar desde o uso de câmeras CCTV e IP pré-existentes para segurança até o aproveitamento do aprendizado de máquina de modelos pré-treinados. O desafio permanece na simplificação dos processos complexos necessários para conectar esses elementos díspares.
Reconhecendo essa oportunidade, plataformas como a Vertex AI Vision eliminam a complexidade com ferramentas fáceis de usar e no-code que unem fontes de vídeo, modelos e mecanismos de análise. Isso não apenas maximiza a eficiência, mas também abre as portas para a adoção acelerada da visão computacional com IA em vários setores.
O Vertex AI Vision do Google integra vários componentes para oferecer uma experiência de usuário perfeita enquanto extrai insights de IA de visão computacional. Os usuários podem trabalhar com modelos pré-treinados no ambiente ou importar modelos personalizados treinados na plataforma Vertex AI. A chave para o Vertex AI Vision é a tela em branco na qual os usuários montam visualmente um pipeline de inferência de visão de IA usando elementos drag-and-drop. Os conectores disponíveis oferecem suporte a fluxos de câmera/vídeo, uma variedade de modelos pré-treinados e especializados, modelos personalizados de AutoML ou Vertex AI e opções de armazenamento de dados como BigQuery e AI Vision Warehouse.
Os principais recursos do Vertex AI Vision incluem:
- Vertex AI Vision Streams: um serviço endpoint para ingestão de streams de vídeo e imagens de uma rede geograficamente distribuída. O Google lida com o dimensionamento e a ingestão, permitindo que dispositivos e câmeras se conectem facilmente.
- Vertex AI Vision Applications: Processamento de mídia extenso e autoescalonado e pipelines analíticos são construídos usando esta plataforma de orquestração sem servidor.
- Modelos de visão Vertex AI: os clientes têm acesso a modelos de visão pré-construídos para tarefas analíticas padrão, como contagem de ocupação, detecção de EPI, desfoque facial e reconhecimento de produtos de varejo. Os usuários também podem criar e implantar seus modelos treinados na plataforma Vertex AI.
- Vertex AI Vision Warehouse: combinando a pesquisa do Google e os recursos de armazenamento de vídeo gerenciado, este sistema integrado de armazenamento de mídia avançada sem servidor é capaz de lidar com petabytes de dados de vídeo.
Após a criação visual do pipeline, a implantação é direta. As marcas verdes mostradas durante a implantação indicam sucesso. Após a implantação, o Google oferece uma ferramenta de linha de comando chamada vaictl para lidar com feeds de vídeo e direcioná-los para o endpoint apropriado do Vertex AI Vision . Os fluxos de entrada e saída podem ser monitorados e, devido ao AI Vision Warehouse, podem ser consultados com base em critérios de pesquisa específicos.
O Vertex AI Vision oferece um SDK para comunicação programática com o warehouse, enquanto as bibliotecas existentes podem ser usadas para desenvolvedores do BigQuery realizarem consultas avançadas com base em ANSI SQL. Para permitir o processamento personalizado, o Google também integrou o Cloud Functions para manipular a saída e adicionar anotações ou metadados adicionais.
O Vertex AI Vision do Google Cloud faz progressos significativos na simplificação da implementação de visão AI com seu ambiente no-code e recursos de integração. O poder real da plataforma vem de sua integração perfeita com outros serviços essenciais do Google Cloud, como BigQuery, Cloud Functions e Vertex AI. Para liberar totalmente o potencial da plataforma, é necessário mais suporte para implantação de ponta. Setores como saúde, seguros e automotivo contam com pipelines de IA de visão na borda para latência reduzida e requisitos de conformidade. A expansão do suporte para implantação de borda será crucial para o sucesso futuro da Vertex AI Vision.
Ferramentas No-code como Vertex AI Vision e AppMaster Platform, promovem a acessibilidade e capacitam desenvolvedores de todos os níveis de habilidade a criar aplicativos inovadores. Com plataformas como AppMaster e Vertex AI Vision, processos anteriormente complexos foram simplificados, trazendo aplicativos escaláveis e de alto desempenho para empresas em geral.