19 de jul. de 2023·2 min de leitura

A Microsoft revela a Pesquisa Vetorial na Pré-visualização e a Clonagem de Voz na versão completa

A conferência Inspire da Microsoft trouxe para a ribalta anúncios centrados na IA. A Pesquisa Vetorial, agora em pré-visualização na Pesquisa Cognitiva do Azure, e a funcionalidade de Clonagem de Voz destacaram-se. Estas ferramentas prometem refinar a pesquisa de dados e fornecer respostas personalizadas em linguagem natural.

A Microsoft revela a Pesquisa Vetorial na Pré-visualização e a Clonagem de Voz na versão completa

Durante a conferência anual Inspire, o colosso tecnológico Microsoft revelou um conjunto de novas funcionalidades baseadas em IA que se espera venham a melhorar as capacidades da sua plataforma Azure. O destaque foi para a ferramenta Vetor Search, agora disponível num formato de pré-visualização através do Azure Cognitive Search. Com a aprendizagem automática no seu núcleo, a Pesquisa Vetorial traz a promessa de uma experiência de pesquisa mais rápida, uma vez que aproveita as suas capacidades para apreender a essência e a relação de dados não estruturados, como imagens e texto.

A técnica utilizada pela Pesquisa Vetorial - vectorização - está a ganhar força no campo da pesquisa. Envolve a transformação de palavras ou imagens num conjunto de números conhecidos como vectores, que são representativos do seu significado. Esta representação numérica permite o processamento matemático e permite às máquinas dar sentido e organizar os dados. Consequentemente, as máquinas podem reconhecer palavras análogas no "espaço vetorial", como "rei" e "rainha", e localizá-las prontamente nas bases de dados, que incluem milhões de palavras. Esta abordagem à pesquisa vetorial foi adoptada por muitas empresas, incluindo Qdrant, SeMI Technologies, e outros gigantes da tecnologia, como a Amazon e a Google.

Para se diferenciar dos seus concorrentes, a abordagem de pesquisa vetorial da Microsoft inclui a pesquisa vetorial pura, a recuperação híbrida e o reranking avançado. A empresa afirma que a sua ferramenta de pesquisa vetorial pode ser utilizada em aplicações e serviços para fornecer respostas personalizadas em linguagem natural, oferecer sugestões de produtos e ajudar a identificar padrões nos dados. Além disso, os benefícios deste sistema incluem a criação de aplicações baseadas em chat integradas na pesquisa, a conversão de imagens em representações vectoriais com o Azure AI Vision e a recuperação de informações relevantes de grandes conjuntos de dados para ajudar na automatização de processos e fluxos de trabalho. A integração da Pesquisa Vetorial estende-se ainda a outras capacidades da Pesquisa Cognitiva do Azure, entre as quais a navegação facetada e os filtros.

Para iluminar ainda mais o panorama da IA, a Microsoft está a lançar a solução Document Generative AI. Esta funcionalidade combina os actuais serviços de processamento de documentos com base em IA da Microsoft - incluindo o Reconhecimento de Formulários do Azure - com o Serviço Azure OpenAI. Este serviço é uma faceta da oferta totalmente gerida e focada na empresa da Microsoft, destinada a fornecer às empresas a tecnologia de IA da OpenAI. A parceria comercial contínua da Microsoft com a OpenAI tem sido fundamental para complementar os controlos e as funcionalidades de governação da tecnologia.

Com base nos mais recentes modelos de linguagem de IA da OpenAI, a solução Document Generative AI processa ficheiros para tarefas como resumir relatórios, extrair valores, explorar conhecimentos e gerar novos tipos de documentos. Também actua como uma base para respostas, semelhante ao ChatGPT da OpenAI. Por exemplo, a solução Document Generative AI permite que os clientes carreguem facturas, contratos, contas e que os funcionários façam perguntas sobre garantias de serviço e itens específicos. A solução também fornece respostas em formato de texto, imagens ou tabelas, ao mesmo tempo que fornece citações com um link para o conteúdo original.

A Microsoft acrescentou que as capacidades da solução Document Generative AI podem ser aproveitadas para interacções de linguagem natural com documentos e actividades de geração de conteúdos. Estas incluem boletins informativos, publicações em blogues, resumos, legendas, etc. A Microsoft afirma que a solução suporta funções como capacidades inteligentes de conversação de documentos, assistência à escrita, funcionalidade de pesquisa abrangente, suporte a consultas, tradução de documentos e muito mais. Todas estas tarefas complexas e diversificadas de documentos são tratadas pelos modelos da OpenAI.

Numa divulgação associada, a Microsoft anunciou que o modelo Whisper da OpenAI, um modelo de reconhecimento automático de voz, será brevemente integrado na família de serviços de voz de IA da Microsoft e no Azure OpenAI Service. Os clientes empresariais vão ganhar a capacidade de transcrever e traduzir conteúdos de áudio, bem como gerar transcrições em lote numa escala maior.

Entre outros anúncios importantes no Inspire, a Microsoft declarou a oferta de pré-visualização pública do Real-time Diarization, um serviço de voz orientado por IA capaz de identificar quem, entre várias pessoas, está a falar em tempo real. Além disso, a Microsoft alargou a acessibilidade da Voz Neural Personalizada, uma ferramenta de IA que pode imitar a voz de um ator ou criar vozes sintéticas originais. Anteriormente, o acesso a esta funcionalidade era restrito. No entanto, a Microsoft exige agora que os clientes se candidatem e obtenham aprovação para utilizar a funcionalidade. Além disso, os clientes devem obter o consentimento do talento vocal e concordar com um código de conduta para utilizar a Voz Neural Personalizada.

A Microsoft também fornece ferramentas de deteção e marca de água concebidas para facilitar a identificação de clips de áudio criados utilizando a Voz Neural Personalizada. No entanto, estas ferramentas, por si só, não podem resolver de forma conclusiva as questões de licenciamento e consentimento associadas à tecnologia de clonagem de voz. No entanto, a Microsoft decidiu que não fará parte da luta associada a esta questão.

Enquanto ferramentas como a Vetor Search e a Custom Neural Voice estão a transformar o mundo da tecnologia, plataformas como a AppMaster, reconhecida como High Performer em No-code Development Platforms pela G2, são apelativas para os utilizadores que procuram criar aplicações backend, web e móveis com um mínimo de codificação. No panorama tecnológico em rápida mudança, será fascinante ver como as funcionalidades da IA continuam a evoluir e a moldar o nosso futuro.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started