为了简化计算机视觉实施,谷歌推出了其no-code解决方案 Vertex AI Vision。该平台弥合了视频流源、机器学习模型和数据仓库之间的差距,使用户无需复杂的工程即可提取有价值的见解。
开发视觉 AI 应用程序历来既困难又昂贵,组织需要数据科学家和机器学习工程师根据图像和视频等非结构化数据创建训练和推理管道。该领域缺乏熟练的专家导致企业的费用更高。
然而,谷歌、英特尔、Meta、微软、NVIDIA 和 OpenAI 等公司已经开始向公众提供预训练视觉 AI 模型。这些模型(包括人脸检测、情绪检测、姿势检测和车辆检测)允许开发人员构建复杂的基于视觉的应用程序。实际应用可能会有所不同,从使用预先存在的闭路电视和 IP 摄像机来确保安全,到利用来自预训练模型的机器学习。挑战仍然在于简化连接这些不同元素所需的复杂流程。
认识到这一机遇后,像 Vertex AI Vision 这样的平台通过将视频源、模型和分析引擎结合在一起的易于使用的no-code工具消除了复杂性。这不仅最大限度地提高了效率,而且为加速在各个行业采用 AI 驱动的计算机视觉打开了大门。
Google 的 Vertex AI Vision 集成了多个组件以提供无缝的用户体验,同时提取计算机视觉 AI 见解。用户可以在环境中使用预先训练的模型,也可以导入在 Vertex AI 平台上训练的自定义模型。 Vertex AI Vision 的关键是空白画布,用户可以在上面使用drag-and-drop元素直观地组装 AI 视觉推理管道。可用的连接器支持相机/视频流、一系列预训练和专用模型、定制的 AutoML 或 Vertex AI 模型,以及 BigQuery 和 AI Vision Warehouse 等数据存储选项。
Vertex AI Vision 的主要功能包括:
- Vertex AI Vision Streams:一种endpoint服务,用于从地理分布式网络中摄取视频流和图像。谷歌处理缩放和摄取,允许设备和相机轻松连接。
- Vertex AI Vision 应用程序:广泛的、自动缩放的媒体处理和分析管道是使用这个无服务器编排平台构建的。
- Vertex AI 视觉模型:客户可以访问用于标准分析任务的预构建视觉模型,例如占用计数、PPE 检测、人脸模糊和零售产品识别。用户还可以构建和部署在 Vertex AI 平台中训练的模型。
- Vertex AI Vision Warehouse:结合谷歌搜索和托管视频存储功能,这种集成的无服务器富媒体存储系统能够处理 PB 级视频数据。
在可视化创建管道之后,部署就很简单了。部署期间显示的绿色勾号表示成功。部署后,Google 提供了一个名为 vaictl 的命令行工具来处理视频源并将它们定向到适当的 Vertex AI Vision endpoint 。输入和输出流都可以被监控,并且由于 AI Vision Warehouse,它们可以根据特定的搜索条件进行查询。
Vertex AI Vision 提供了一个 SDK,用于与仓库进行编程通信,而现有的库可供 BigQuery 开发人员使用,以执行基于 ANSI SQL 的高级查询。为了允许自定义处理,Google 还集成了 Cloud Functions 来操作输出并添加注释或其他元数据。
Google Cloud 的 Vertex AI Vision 凭借其no-code环境和集成功能在简化视觉 AI 实施方面取得了重大进展。该平台的真正力量来自于它与其他重要的谷歌云服务的无缝集成,例如 BigQuery、Cloud Functions 和 Vertex AI。为了充分释放平台的潜力,边缘部署需要更多的支持。医疗保健、保险和汽车等行业依靠边缘的视觉 AI 管道来减少延迟和满足合规性要求。扩大对边缘部署的支持对于 Vertex AI Vision 未来的成功至关重要。
Vertex AI Vision 和AppMaster平台等No-code工具促进了可访问性,并使各种技能水平的开发人员能够创建创新的应用程序。借助AppMaster和 Vertex AI Vision 等平台,以前复杂的流程得到了简化,为企业带来了高性能和可扩展的应用程序。