19 jul 2023·2 min leestijd

Microsoft onthult Vector Search in Preview en Voice Cloning in Full Release

Microsofts Inspire-conferentie bracht AI-gerichte aankondigingen voor het voetlicht. De Vector Search, nu in preview in Azure Cognitive Search, en de Voice Cloning functie vielen op. Deze tools beloven het zoeken naar gegevens te verfijnen en gepersonaliseerde antwoorden in natuurlijke taal te geven.

Microsoft onthult Vector Search in Preview en Voice Cloning in Full Release

Tijdens de jaarlijkse Inspire-conferentie onthulde technologiekolos Microsoft een reeks nieuwe AI-functies waarvan verwacht wordt dat ze de mogelijkheden van het Azure-platform zullen vergroten. De schijnwerpers werden gericht op de Vector Search tool, die nu beschikbaar is in preview-formaat via Azure Cognitive Search. Met machine learning als kern brengt Vector Search de belofte van een snellere zoekervaring, omdat het gebruik maakt van zijn mogelijkheden om de essentie en verwantschap van ongestructureerde gegevens, zoals afbeeldingen en tekst, te begrijpen.

De techniek die wordt gebruikt door Vector Search - vectorisatie - wint aan belang binnen het zoekveld. Het gaat om de transformatie van woorden of afbeeldingen in een reeks getallen, vectoren genaamd, die representatief zijn voor hun betekenis. Deze numerieke representatie maakt wiskundige verwerking mogelijk en stelt machines in staat om gegevens te begrijpen en te organiseren. Bijgevolg kunnen machines analoge woorden herkennen binnen de 'vectorruimte', zoals 'koning' en 'koningin', en ze onmiddellijk lokaliseren binnen databases die miljoenen woorden bevatten. Deze benadering van vectorzoeken is overgenomen door veel bedrijven, waaronder Qdrant, SeMI Technologies, en andere techgiganten zoals Amazon en Google.

Om zich te onderscheiden van zijn concurrenten, omvat Microsofts vectorzoekbenadering zuiver vectorzoeken, hybride herstel en geavanceerde herrangschikking. Het bedrijf stelt dat zijn vectorzoektool kan worden gebruikt in apps en diensten om gepersonaliseerde antwoorden in natuurlijke taal te geven, productsuggesties te doen en patronen in de gegevens te helpen identificeren. De voordelen van dit systeem zijn onder andere het bouwen van chat-gebaseerde apps met zoekfunctie, het omzetten van afbeeldingen in vectorrepresentaties met Azure AI Vision en het ophalen van relevante informatie uit grote datasets om processen en workflow-automatisering te ondersteunen. De integratie van Vector Search strekt zich verder uit naar andere mogelijkheden van Azure Cognitive Search, waaronder gefacetteerde navigatie en filters.

Om het AI-landschap verder te verduidelijken, rolt Microsoft de Document Generative AI-oplossing uit. Deze functie voegt Microsofts bestaande AI-ondersteunde documentverwerkingsdiensten - waaronder Azure Form Recognizer - samen met de Azure OpenAI Service. Deze service is een facet van Microsofts volledig beheerde, bedrijfsgerichte aanbod dat bedoeld is om bedrijven te voorzien van AI-technologie van OpenAI. Microsofts voortdurende commerciële samenwerking met OpenAI heeft een belangrijke rol gespeeld bij het aanvullen van de controle- en beheerfuncties van de technologie.

Op basis van de nieuwste AI-taalmodellen van OpenAI verwerkt de Document Generative AI-oplossing bestanden voor taken als het samenvatten van rapporten, het extraheren van waarden, het verzamelen van kennis en het genereren van nieuwe soorten documenten. Het fungeert ook als basis voor reacties, vergelijkbaar met OpenAI's ChatGPT. Met de Document Generative AI-oplossing kunnen klanten bijvoorbeeld facturen, contracten en rekeningen uploaden en kunnen medewerkers vragen stellen over servicegaranties en specifieke regelitems. De oplossing geeft ook antwoorden in tekstformaat, afbeeldingen of tabellen, terwijl citaten worden voorzien van een link naar de originele inhoud.

Microsoft voegde eraan toe dat de mogelijkheden van de Document Generative AI-oplossing kunnen worden ingezet voor interacties in natuurlijke taal met documenten en het genereren van content. Hieronder vallen nieuwsbrieven, blog posts, samenvattingen, bijschriften, etc. Microsoft stelt dat de oplossing functies ondersteunt zoals intelligente chatfuncties voor documenten, hulp bij het schrijven, uitgebreide zoekfunctionaliteit, ondersteuning bij zoekopdrachten, vertaling van documenten en nog veel meer. Al deze complexe en uiteenlopende documenttaken worden afgehandeld door de modellen van OpenAI.

In een gekoppelde bekendmaking kondigde Microsoft aan dat OpenAI's Whisper-model, een model voor automatische spraakherkenning, binnenkort zal worden geïntegreerd in Microsofts familie van AI-spraakdiensten en de Azure OpenAI Service. Enterprise-klanten krijgen de mogelijkheid om audio-inhoud te transcriberen en te vertalen, en om op grotere schaal batchtranscripties te genereren.

Naast andere belangrijke aankondigingen tijdens Inspire, kondigde Microsoft de publieke preview aan voor Real-time Diarization, een AI-gestuurde spraakdienst die in staat is om te identificeren wie van meerdere mensen in realtime aan het woord is. Verder verruimde Microsoft de toegankelijkheid van Custom Neural Voice, een AI-tool die de stem van een acteur kan nabootsen of originele synthetische stemmen kan creëren. Voorheen was de toegang tot deze functie beperkt. Microsoft vereist nu echter dat klanten een aanvraag indienen en goedkeuring krijgen om de functie te gebruiken. Daarnaast moeten klanten toestemming krijgen van de stemacteur en akkoord gaan met een gedragscode om Custom Neural Voice te kunnen gebruiken.

Microsoft biedt ook watermerk- en detectiehulpmiddelen die zijn ontworpen om de identificatie van audioclips die zijn gemaakt met behulp van Custom Neural Voice te vergemakkelijken. Deze tools alleen kunnen echter geen sluitende oplossing bieden voor de licentie- en toestemmingsproblemen die gepaard gaan met technologie voor het klonen van stemmen. Desondanks heeft Microsoft besloten dat het zich niet zal mengen in de strijd rond deze kwestie.

Terwijl tools als Vector Search en Custom Neural Voice de techwereld transformeren, zijn platforms als AppMaster, door G2 erkend als een High Performer in No-code Development Platforms, aantrekkelijk voor gebruikers die backend-, web- en mobiele applicaties willen maken met een minimum aan codering. In het snel veranderende technologielandschap zal het fascinerend zijn om te zien hoe AI-functies zich blijven ontwikkelen en onze toekomst vormgeven.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started
Microsoft onthult Vector Search in Preview en Voice Cloning in Full Release | AppMaster