19 jul 2023·2 min de lectura

Microsoft presenta la búsqueda vectorial en la versión preliminar y la clonación de voz en la versión completa

La conferencia Inspire de Microsoft trajo anuncios centrados en la IA. Destacaron la búsqueda vectorial, ahora en vista previa en Azure Cognitive Search, y la función de clonación de voz. Estas herramientas prometen refinar la búsqueda de datos y ofrecer respuestas personalizadas en lenguaje natural.

Microsoft presenta la búsqueda vectorial en la versión preliminar y la clonación de voz en la versión completa

Durante la conferencia anual Inspire, el coloso tecnológico Microsoft desveló una serie de nuevas funciones basadas en IA que se espera mejoren las capacidades de su plataforma Azure. El centro de atención fue la herramienta Vector Search, ahora disponible en formato de vista previa a través de Azure Cognitive Search. Con el aprendizaje automático en su núcleo, Vector Search promete una experiencia de búsqueda más rápida, ya que aprovecha sus capacidades para aprehender la esencia y la relación de los datos no estructurados, como imágenes y texto.

La técnica empleada por Vector Search -vectorización- está ganando impulso en el campo de la búsqueda. Consiste en la transformación de palabras o imágenes en un conjunto de números conocidos como vectores, que son representativos de su significado. Esta representación numérica permite el procesamiento matemático y permite a las máquinas dar sentido y organizar los datos. Así, las máquinas pueden reconocer palabras análogas en el "espacio vectorial", como "rey" y "reina", y localizarlas rápidamente en bases de datos que contienen millones de palabras. Este enfoque de la búsqueda vectorial ha sido adoptado por muchas empresas, como Qdrant, SeMI Technologies y otros gigantes tecnológicos como Amazon y Google.

Para diferenciarse de sus competidores, el enfoque de búsqueda vectorial de Microsoft incluye búsqueda vectorial pura, recuperación híbrida y reordenación avanzada. La empresa afirma que su herramienta de búsqueda vectorial puede emplearse en aplicaciones y servicios para dar respuestas personalizadas en lenguaje natural, ofrecer sugerencias de productos y ayudar a identificar patrones en los datos. Además, las ventajas de este sistema incluyen la creación de aplicaciones basadas en chat e integradas en la búsqueda, la conversión de imágenes en representaciones vectoriales con Azure AI Vision y la recuperación de información relevante a partir de grandes conjuntos de datos para facilitar la automatización de procesos y flujos de trabajo. La integración de Vector Search se extiende además a otras capacidades de Azure Cognitive Search, entre ellas la navegación por facetas y los filtros.

Para iluminar aún más el panorama de la IA, Microsoft está desplegando la solución Document Generative AI. Esta función combina los servicios de procesamiento de documentos basados en IA de Microsoft, incluido Azure Form Recognizer, con el servicio Azure OpenAI. Este servicio es una faceta de la oferta de Microsoft totalmente gestionada y centrada en la empresa, destinada a proporcionar a las empresas tecnología de IA de OpenAI. La continua asociación comercial de Microsoft con OpenAI ha sido fundamental para complementar los controles y las funciones de gobierno de la tecnología.

Basándose en los últimos modelos lingüísticos de IA de OpenAI, la solución Document Generative AI procesa archivos para tareas como resumir informes, extraer valores, extraer conocimientos y generar nuevos tipos de documentos. También actúa como base para las respuestas, de forma similar a ChatGPT de OpenAI. Por ejemplo, la solución Document Generative AI permite a los clientes cargar facturas, contratos y recibos, y a los empleados realizar consultas sobre garantías de servicio y partidas específicas. La solución también ofrece respuestas en formato de texto, imágenes o tablas, al tiempo que proporciona citas con un enlace al contenido original.

Microsoft añadió que las capacidades de la solución Document Generative AI pueden aprovecharse para interacciones en lenguaje natural con documentos y actividades de generación de contenidos. Esto incluye boletines, entradas de blog, resúmenes, pies de foto, etc. Microsoft afirma que la solución admite funciones como capacidades de chat inteligente de documentos, asistencia en la redacción, funcionalidad de búsqueda exhaustiva, soporte de consultas, traducción de documentos, etc. Todas estas complejas y diversas tareas documentales son gestionadas por los modelos de OpenAI.

En un comunicado vinculado, Microsoft anunció que el modelo Whisper de OpenAI, un modelo de reconocimiento automático del habla, se integrará pronto en la familia de servicios de habla de IA de Microsoft y en el servicio Azure OpenAI. Los clientes empresariales podrán transcribir y traducir contenido de audio, así como generar transcripciones por lotes a gran escala.

Entre otros anuncios importantes en Inspire, Microsoft declaró la oferta de la vista previa pública de Real-time Diarization, un servicio de voz basado en IA capaz de identificar quién de entre varias personas está hablando en tiempo real. Además, Microsoft amplió la accesibilidad de Custom Neural Voice, una herramienta de IA que puede imitar fielmente la voz de un actor o crear voces sintéticas originales. Antes, el acceso a esta función estaba restringido. Sin embargo, ahora Microsoft exige a los clientes que soliciten y obtengan la aprobación para utilizarla. Además, los clientes deben obtener el consentimiento del locutor y aceptar un código de conducta para utilizar Custom Neural Voice.

Microsoft también proporciona marcas de agua y herramientas de detección diseñadas para facilitar la identificación de los clips de audio creados con Custom Neural Voice. Sin embargo, estas herramientas por sí solas no pueden resolver de forma concluyente los problemas de licencia y consentimiento asociados a la tecnología de clonación de voz. No obstante, Microsoft ha decidido que no participará en la lucha asociada a este asunto.

Mientras que herramientas como Vector Search y Custom Neural Voice están transformando el mundo de la tecnología, plataformas como AppMaster, reconocida como High Performer en No-code Development Platforms por G2, resultan atractivas para los usuarios que buscan crear aplicaciones backend, web y móviles con una codificación mínima. En un panorama tecnológico en rápida evolución, será fascinante ver cómo las funcionalidades de la IA siguen evolucionando y dando forma a nuestro futuro.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started
Microsoft presenta la búsqueda vectorial en la versión preliminar y la clonación de voz en la versión completa | AppMaster