En un movimiento para simplificar la implementación de la visión artificial, Google ha presentado su solución no-code, Vertex AI Vision. La plataforma cierra la brecha entre las fuentes de flujo de video, los modelos de aprendizaje automático y los almacenes de datos, lo que permite a los usuarios extraer información valiosa sin necesidad de ingeniería compleja.
Históricamente, desarrollar aplicaciones de IA de visión ha sido difícil y costoso, y las organizaciones necesitan científicos de datos e ingenieros de aprendizaje automático para crear canalizaciones de capacitación e inferencia basadas en datos no estructurados, como imágenes y videos. La escasez de especialistas capacitados en esta área generó gastos aún mayores para las empresas.
Sin embargo, empresas como Google, Intel, Meta, Microsoft, NVIDIA y OpenAI han comenzado a poner a disposición del público modelos de IA de visión previamente entrenados. Estos modelos, que incluyen detección de rostros, detección de emociones, detección de poses y detección de vehículos, permiten a los desarrolladores crear aplicaciones sofisticadas basadas en la visión. Las aplicaciones prácticas pueden variar desde el uso de cámaras CCTV e IP preexistentes para la seguridad hasta el aprovechamiento del aprendizaje automático de modelos previamente entrenados. El desafío sigue siendo la racionalización de los complejos procesos necesarios para conectar estos elementos dispares.
Al reconocer esta oportunidad, plataformas como Vertex AI Vision eliminan la complejidad con herramientas fáciles de usar y no-code que unen fuentes de video, modelos y motores de análisis. Esto no solo maximiza la eficiencia, sino que abre la puerta para la adopción acelerada de la visión por computadora impulsada por IA en varias industrias.
Vertex AI Vision de Google integra múltiples componentes para ofrecer una experiencia de usuario perfecta mientras extrae información de IA de visión por computadora. Los usuarios pueden trabajar con modelos previamente entrenados dentro del entorno o importar modelos personalizados entrenados en la plataforma Vertex AI. La clave de Vertex AI Vision es el lienzo en blanco en el que los usuarios ensamblan visualmente una canalización de inferencia de visión de IA utilizando elementos drag-and-drop. Los conectores disponibles admiten transmisiones de cámara/video, una variedad de modelos preentrenados y especializados, modelos AutoML o Vertex AI personalizados y opciones de almacenamiento de datos como BigQuery y AI Vision Warehouse.
Las características clave de Vertex AI Vision incluyen:
- Vertex AI Vision Streams: un servicio endpoint para ingerir secuencias de video e imágenes de una red distribuida geográficamente. Google maneja el escalado y la ingestión, lo que permite que los dispositivos y las cámaras se conecten fácilmente.
- Aplicaciones Vertex AI Vision: las canalizaciones de análisis y procesamiento de medios extensivas y de escala automática se construyen utilizando esta plataforma de orquestación sin servidor.
- Modelos de visión de IA de Vertex: los clientes tienen acceso a modelos de visión preconstruidos para tareas de análisis estándar, como el recuento de ocupación, la detección de EPP, el desenfoque de rostros y el reconocimiento de productos minoristas. Los usuarios también pueden construir e implementar sus modelos entrenados dentro de la plataforma Vertex AI.
- Vertex AI Vision Warehouse: Al combinar la búsqueda de Google y las capacidades de almacenamiento de video administrado, este sistema integrado de almacenamiento de medios enriquecidos sin servidor es capaz de manejar petabytes de datos de video.
Después de la creación visual de la canalización, la implementación es sencilla. Las marcas de verificación verdes que se muestran durante la implementación indican que se ha realizado correctamente. Después de la implementación, Google ofrece una herramienta de línea de comandos llamada vaictl para manejar las transmisiones de video y las dirige al endpoint de Vertex AI Vision apropiado. Tanto los flujos de entrada como los de salida se pueden monitorear y, debido a AI Vision Warehouse, se pueden consultar en función de criterios de búsqueda específicos.
Vertex AI Vision ofrece un SDK para la comunicación programática con el almacén, mientras que las bibliotecas existentes se pueden usar para que los desarrolladores de BigQuery realicen consultas avanzadas basadas en ANSI SQL. Para permitir el procesamiento personalizado, Google también ha integrado Cloud Functions para manipular la salida y agregar anotaciones o metadatos adicionales.
Vertex AI Vision de Google Cloud logra avances significativos en la simplificación de la implementación de Vision AI con su entorno no-code y capacidades de integración. El poder real de la plataforma proviene de su perfecta integración con otros servicios esenciales de Google Cloud, como BigQuery, Cloud Functions y Vertex AI. Para desbloquear completamente el potencial de la plataforma, se necesita más soporte para la implementación perimetral. Industrias como la atención médica, los seguros y la automoción confían en canalizaciones de IA de visión en el perímetro para reducir la latencia y los requisitos de cumplimiento. La expansión del soporte para la implementación perimetral será crucial para el éxito futuro de Vertex AI Vision.
Las herramientas No-code como Vertex AI Vision y AppMaster Platform, fomentan la accesibilidad y capacitan a los desarrolladores de todos los niveles para crear aplicaciones innovadoras. Con plataformas como AppMaster y Vertex AI Vision, los procesos que antes eran complejos se han simplificado, brindando aplicaciones escalables y de alto rendimiento a las empresas en todos los ámbitos.