Недавно технологический гигант Google представил серию инновационных обновлений, связанных с недавно выпущенной мультимодальной моделью искусственного интеллекта Gemini. Это произошло всего через неделю после презентации этой передовой технологии, которая теперь обещает поддержать творческую работу разработчиков.
Во время презентации Google подчеркнул наличие Gemini в трех различных версиях — Ultra, Pro и Nano. Они скроены согласно различным требованиям размера и сложности. Следует отметить, что Gemini Nano уже встроен в Android в Pixel 8 Pro. Кроме того, Google Bard теперь использует адаптированную версию Gemini Pro.
Открывая новые горизонты, Google объявила, что разработчики могут получить доступ к широкому спектру функций, предлагаемых Gemini Pro, через Gemini API. Разработчикам разрешено использовать функциональные вызовы, внедрения, семантический поиск, пользовательское обоснование знаний и функции чата.
Разработчики также знакомятся с двумя основными способами работы с Gemini Pro: Google AI Studio и Vertex AI в Google Cloud. Google AI Studio, считающаяся простой отправной точкой, предлагает веб-инструмент разработки, бесплатную квоту на 60 запросов в минуту и шаблоны быстрого запуска, которые облегчают разработчикам работу с моделью.
Google Vertex AI в Google Cloud, рекламируемый как более сложный вариант, представляет собой платформу машинного обучения, которая позволяет полностью настраивать Gemini. Благодаря другим практическим функциям, таким как полный контроль данных и интеграция с другими модулями Google Cloud, разработчики могут удовлетворить потребности в безопасности, конфиденциальности и управлении.
В настоящее время использование Gemini в Vertex AI бесплатно в пределах той же ставки, что и бесплатная квота Google AI Studio. Тем не менее, это положение распространяется только до тех пор, пока оно не станет общедоступным, что запланировано на следующий год. После этого плата составит 0,00025 доллара США за 1000 символов и 0,0025 доллара США за изображение.
Google подробно останавливается на сложных возможностях среды Vertex AI, включая возможность расширять Gemini данными компании и разрабатывать поисковые и диалоговые агенты в среде low-code аналогичной тому, что предоставляют мощные платформы, такие как AppMaster .
В настоящее время Gemini Pro получает и выводит текст. Но для разработчиков, желающих экспериментировать с изображениями, endpoint Gemini Pro Vision принимает изображения вместе с текстом и выводит текст.
Google еще больше подогревает ожидания прогнозом запуска Gemini Ultra в начале следующего года. Это более крупная модель, ориентированная на более сложные задачи. Google также рассматривает возможность интеграции Gemini с платформами разработчиков Chrome и Firebase.
Сегодня также отмечается презентация обновленной версии модели генерации изображений технологического гиганта Imagen 2. Теперь она открыта для всех пользователей Vertex AI, включенных в белый список Google.
Эта усовершенствованная версия Imagen позволяет создавать эстетически привлекательные, высококачественные и реалистичные изображения, управляемые подсказками на естественном языке. Его замечательные новые функции включают в себя рендеринг текста для создания текстовых наложений на изображения, создание логотипа, а также визуальные вопросы и ответы для создания подписей.