Стремясь упростить реализацию компьютерного зрения, Google представила решение Vertex AI Vision no-code. Платформа устраняет разрыв между источниками видеопотока, моделями машинного обучения и хранилищами данных, позволяя пользователям извлекать ценную информацию без необходимости сложного проектирования.
Исторически разработка приложений искусственного интеллекта для зрения была сложной и дорогостоящей задачей, поскольку организациям требовались специалисты по данным и инженеры по машинному обучению для создания конвейеров обучения и логического вывода на основе неструктурированных данных, таких как изображения и видео. Нехватка квалифицированных специалистов в этой области приводила к еще большим затратам предприятий.
Однако такие компании, как Google, Intel, Meta, Microsoft, NVIDIA и OpenAI, начали делать общедоступными предварительно обученные модели искусственного интеллекта. Эти модели, включая распознавание лиц, распознавание эмоций, распознавание поз и распознавание транспортных средств, позволяют разработчикам создавать сложные приложения на основе зрения. Практические приложения могут варьироваться от использования уже существующих камер видеонаблюдения и IP-камер для обеспечения безопасности до использования машинного обучения на предварительно обученных моделях. Проблема остается в рационализации сложных процессов, необходимых для соединения этих разрозненных элементов.
Признавая эту возможность, такие платформы, как Vertex AI Vision, устраняют сложность с помощью простых в использовании инструментов no-code, которые объединяют источники видео, модели и аналитические механизмы. Это не только максимизирует эффективность, но и открывает двери для ускоренного внедрения компьютерного зрения на основе ИИ в различных отраслях.
Vertex AI Vision от Google объединяет несколько компонентов, чтобы обеспечить беспрепятственный пользовательский интерфейс при извлечении идей ИИ компьютерного зрения. Пользователи могут либо работать с предварительно обученными моделями в среде, либо импортировать пользовательские модели, обученные на платформе Vertex AI. Ключом к Vertex AI Vision является пустой холст, на котором пользователи визуально собирают конвейер логического вывода ИИ, используя элементы drag-and-drop. Доступные соединители поддерживают потоки камер/видео, ряд предварительно обученных и специализированных моделей, настраиваемые модели AutoML или Vertex AI, а также варианты хранения данных, такие как BigQuery и AI Vision Warehouse.
Ключевые особенности Vertex AI Vision включают в себя:
- Vertex AI Vision Streams: служба endpoint для приема видеопотоков и изображений из географически распределенной сети. Google управляет масштабированием и приемом данных, позволяя устройствам и камерам легко подключаться.
- Приложения Vertex AI Vision. С помощью этой бессерверной платформы оркестрации создаются обширные конвейеры обработки мультимедиа и аналитики с автоматическим масштабированием.
- Модели Vertex AI Vision: клиенты имеют доступ к готовым моделям машинного зрения для стандартных аналитических задач, таких как подсчет занятости, обнаружение средств индивидуальной защиты, размытие лиц и распознавание розничных продуктов. Пользователи могут дополнительно создавать и развертывать свои модели, обученные на платформе Vertex AI.
- Vertex AI Vision Warehouse: эта интегрированная бессерверная система хранения мультимедиа, сочетающая возможности поиска Google и управляемого хранилища видео, способна обрабатывать петабайты видеоданных.
После визуального создания конвейера развертывание становится простым. Зеленые галочки, отображаемые во время развертывания, указывают на успех. После развертывания Google предлагает инструмент командной строки под названием vaictl для обработки видеопотоков и направления их на соответствующую endpoint Vertex AI Vision. Можно отслеживать как входные, так и выходные потоки, а благодаря AI Vision Warehouse их можно запрашивать на основе определенных критериев поиска.
Vertex AI Vision предлагает SDK для программного взаимодействия с хранилищем, а существующие библиотеки могут использоваться разработчиками BigQuery для выполнения расширенных запросов на основе ANSI SQL. Чтобы разрешить индивидуальную обработку, Google также интегрировал облачные функции для управления выводом и добавления аннотаций или дополнительных метаданных.
Vertex AI Vision от Google Cloud делает значительные успехи в упрощении реализации искусственного интеллекта благодаря своей среде no-code и возможностям интеграции. Реальная мощь платформы заключается в ее полной интеграции с другими важными облачными сервисами Google, такими как BigQuery, Cloud Functions и Vertex AI. Чтобы полностью раскрыть потенциал платформы, требуется дополнительная поддержка для периферийного развертывания. Такие отрасли, как здравоохранение, страхование и автомобилестроение, полагаются на конвейеры искусственного интеллекта машинного зрения на периферии для сокращения задержек и соответствия требованиям. Расширение поддержки периферийного развертывания будет иметь решающее значение для будущего успеха Vertex AI Vision.
Инструменты No-code такие как Vertex AI Vision и платформа AppMaster, способствуют доступности и позволяют разработчикам всех уровней квалификации создавать инновационные приложения. Благодаря таким платформам, как AppMaster и Vertex AI Vision, ранее сложные процессы были оптимизированы, что позволило использовать высокопроизводительные и масштабируемые приложения для всех предприятий.