19 июл. 2023 г.·2 мин

Microsoft представляет векторный поиск в предварительной версии и голосовое клонирование в полной версии

На конференции Inspire компании Microsoft были сделаны анонсы, ориентированные на ИИ. Особого внимания заслуживает векторный поиск, который сейчас находится в предварительной версии в Azure Cognitive Search, и функция клонирования голоса. Эти инструменты обещают усовершенствовать поиск данных и предоставлять персонализированные ответы на естественном языке.

Microsoft представляет векторный поиск в предварительной версии и голосовое клонирование в полной версии

В ходе ежегодной конференции Inspire технологический колосс Microsoft представил ряд новых функций на базе искусственного интеллекта, которые должны расширить возможности платформы Azure. В центре внимания оказался инструмент Vector Search, который теперь доступен в формате предварительной версии через Azure Cognitive Search. Векторный поиск, в основе которого лежит машинное обучение, обещает ускорить процесс поиска, поскольку использует свои возможности для понимания сути и взаимосвязи неструктурированных данных, таких как изображения и текст.

Техника, используемая в Vector Search, - векторизация - набирает обороты в области поиска. Она предполагает преобразование слов или изображений в набор чисел, называемых векторами, которые отражают их смысл. Такое числовое представление допускает математическую обработку и позволяет машинам осмысливать и упорядочивать данные. Таким образом, машины могут распознавать в "векторном пространстве" слова-аналоги, например "король" и "королева", и оперативно находить их в базах данных, состоящих из миллионов слов. Такой подход к векторному поиску был использован многими компаниями, в том числе Qdrant, SeMI Technologies, а также такими технологическими гигантами, как Amazon и Google.

Отличаясь от своих конкурентов, Microsoft использует такие подходы к векторному поиску, как чисто векторный поиск, гибридное восстановление и расширенное ранжирование. Компания утверждает, что ее инструмент векторного поиска может быть использован в приложениях и сервисах для предоставления персонализированных ответов на естественном языке, предложения продуктов и выявления закономерностей в данных. Кроме того, преимущества этой системы заключаются в создании интегрированных с поиском приложений на основе чатов, преобразовании изображений в векторные представления с помощью Azure AI Vision и извлечении релевантной информации из больших массивов данных для автоматизации процессов и рабочих процессов. Интеграция Vector Search распространяется и на другие возможности Azure Cognitive Search, в том числе на фасетную навигацию и фильтры.

Еще более расширяя возможности ИИ, Microsoft внедряет решение Document Generative AI. Эта функция объединяет существующие сервисы Microsoft по обработке документов с помощью искусственного интеллекта, включая Azure Form Recognizer, с сервисом Azure OpenAI Service. Эта услуга является частью полностью управляемого корпоративного предложения Microsoft, предназначенного для предоставления предприятиям технологий искусственного интеллекта от OpenAI. Постоянное коммерческое партнерство Microsoft с OpenAI сыграло важную роль в дополнении технологии функциями контроля и управления.

Решение Document Generative AI, работающее на основе новейших языковых моделей искусственного интеллекта OpenAI, обрабатывает файлы для решения таких задач, как обобщение отчетов, извлечение ценностей, поиск знаний и создание новых типов документов. Оно также служит основой для ответов, аналогичных ChatGPT от OpenAI. Например, решение Document Generative AI позволяет клиентам загружать счета, договоры, счета-фактуры, а сотрудникам - запрашивать информацию о гарантиях на услуги и конкретных статьях. При этом ответы предоставляются в текстовом формате, в виде изображений или таблиц с указанием ссылки на исходный материал.

Microsoft добавляет, что возможности решения Document Generative AI могут быть использованы для взаимодействия с документами на естественном языке и создания контента. К ним относятся информационные бюллетени, записи в блогах, резюме, подписи и т.д. Microsoft утверждает, что решение поддерживает такие функции, как интеллектуальный чат с документами, помощь в написании текстов, комплексный поиск, поддержка запросов, перевод документов и др. Со всеми этими сложными и разнообразными задачами, связанными с документами, справляются модели из OpenAI.

В связи с этим Microsoft объявила о том, что модель Whisper от OpenAI, предназначенная для автоматического распознавания речи, вскоре будет интегрирована в семейство речевых сервисов ИИ Microsoft и службу Azure OpenAI. Корпоративные заказчики получат возможность расшифровывать и переводить аудиоконтент, а также генерировать пакетные транскрипции в больших масштабах.

Среди других важных анонсов, сделанных на Inspire, Microsoft объявила о начале публичного предварительного просмотра Real-time Diarization - речевого сервиса на базе ИИ, способного определять, кто из нескольких человек говорит в режиме реального времени. Кроме того, Microsoft расширила доступ к Custom Neural Voice - инструменту искусственного интеллекта, позволяющему точно имитировать голос актера или создавать оригинальные синтетические голоса. Ранее доступ к этой функции был ограничен. Однако теперь для использования этой функции необходимо подать заявку и получить одобрение. Кроме того, для использования Custom Neural Voice необходимо получить согласие талантливого исполнителя и принять кодекс поведения.

Microsoft также предоставляет инструменты для создания водяных знаков и обнаружения, призванные облегчить идентификацию аудиоклипов, созданных с помощью Custom Neural Voice. Однако сами по себе эти средства не могут окончательно решить проблемы лицензирования и согласия, связанные с технологией клонирования голоса. Тем не менее, компания Microsoft решила, что не будет участвовать в борьбе, связанной с этим вопросом.

В то время как такие инструменты, как Vector Search и Custom Neural Voice, меняют мир технологий, такие платформы, как AppMaster, признанная компанией G2 высокоэффективной платформой для разработки No-code, привлекают пользователей, желающих создавать внутренние, веб- и мобильные приложения с минимальными затратами на кодирование. В условиях быстро меняющегося технологического ландшафта будет интересно наблюдать за тем, как функции ИИ продолжают развиваться и определять наше будущее.

Легко начать
Создай что-то невероятное

Экспериментируйте с AppMaster с бесплатной подпиской.
Как только вы будете готовы, вы сможете выбрать подходящий платный план.

Попробовать AppMaster