19. Juli 2023·2 Min. Lesezeit

Microsoft stellt die Vektorsuche in der Vorschau und das Stimmenklonen in der Vollversion vor

Auf der Inspire-Konferenz von Microsoft standen KI-zentrierte Ankündigungen im Vordergrund. Die Vektorsuche, die jetzt in Azure Cognitive Search in der Vorschau zu sehen ist, und die Funktion "Voice Cloning" stachen hervor. Diese Tools versprechen, die Datensuche zu verfeinern und personalisierte natürlichsprachliche Antworten zu liefern.

Microsoft stellt die Vektorsuche in der Vorschau und das Stimmenklonen in der Vollversion vor

Während der jährlichen Inspire-Konferenz stellte der Tech-Koloss Microsoft eine Reihe neuer KI-gestützter Funktionen vor, die die Möglichkeiten seiner Azure-Plattform erweitern sollen. Im Mittelpunkt stand das Tool Vector Search, das jetzt in einer Vorschau über Azure Cognitive Search verfügbar ist. Mit maschinellem Lernen als Kernstück verspricht Vector Search ein schnelleres Sucherlebnis, da es seine Fähigkeiten nutzt, um das Wesen und die Zusammenhänge von unstrukturierten Daten wie Bildern und Texten zu erfassen.

Die von der Vektorsuche verwendete Technik - die Vektorisierung - gewinnt im Bereich der Suche zunehmend an Bedeutung. Sie beinhaltet die Umwandlung von Wörtern oder Bildern in eine Reihe von Zahlen, die als Vektoren bezeichnet werden und für ihre Bedeutung repräsentativ sind. Diese numerische Darstellung ermöglicht eine mathematische Verarbeitung und erlaubt es Maschinen, Daten sinnvoll zu nutzen und zu organisieren. Folglich können Maschinen analoge Wörter wie "König" und "Königin" innerhalb des "Vektorraums" erkennen und sie in Datenbanken, die Millionen von Wörtern umfassen, sofort finden. Dieser Ansatz der Vektorsuche wurde von vielen Unternehmen übernommen, darunter Qdrant, SeMI Technologies und andere Tech-Giganten wie Amazon und Google.

Um sich von seinen Konkurrenten zu unterscheiden, umfasst der Vektorsuchansatz von Microsoft eine reine Vektorsuche, eine hybride Wiederherstellung und ein erweitertes Reranking. Das Unternehmen behauptet, dass sein Vektorsuchwerkzeug in Anwendungen und Diensten eingesetzt werden kann, um personalisierte Antworten in natürlicher Sprache zu liefern, Produktvorschläge anzubieten und Muster in den Daten zu erkennen. Zu den Vorteilen dieses Systems gehören außerdem der Aufbau von suchintegrierten, chatbasierten Apps, die Umwandlung von Bildern in Vektordarstellungen mit Azure AI Vision und das Abrufen relevanter Informationen aus großen Datensätzen zur Unterstützung der Prozess- und Workflow-Automatisierung. Die Integration von Vector Search erstreckt sich auch auf andere Azure Cognitive Search-Funktionen, darunter die facettierte Navigation und Filter.

Um die KI-Landschaft weiter zu beleuchten, führt Microsoft die Lösung Document Generative AI ein. Diese Funktion vereint Microsofts bestehende KI-gestützte Dienste zur Dokumentenverarbeitung - einschließlich Azure Form Recognizer - mit dem Azure OpenAI Service. Dieser Service ist eine Facette von Microsofts vollständig verwaltetem, unternehmensorientiertem Angebot, das Unternehmen mit KI-Technologie von OpenAI versorgen soll. Microsofts fortlaufende kommerzielle Partnerschaft mit OpenAI hat entscheidend dazu beigetragen, die Kontroll- und Governance-Funktionen der Technologie zu ergänzen.

Auf der Grundlage der neuesten KI-Sprachmodelle von OpenAI verarbeitet die Document Generative AI-Lösung Dateien für Aufgaben wie die Zusammenfassung von Berichten, die Extraktion von Werten, die Gewinnung von Wissen und die Erstellung neuartiger Dokumente. Sie dient auch als Grundlage für Antworten, ähnlich wie bei OpenAIs ChatGPT. Die Document Generative AI-Lösung ermöglicht es Kunden beispielsweise, Rechnungen, Verträge und Rechnungen hochzuladen und Mitarbeitern die Möglichkeit zu geben, Abfragen zu Servicegarantien und bestimmten Einzelposten zu stellen. Die Lösung liefert auch Antworten im Textformat, in Bildern oder Tabellen, wobei die Zitate mit einem Link zum Originalinhalt versehen werden.

Microsoft fügte hinzu, dass die Funktionen der Document Generative AI-Lösung für natürlichsprachliche Interaktionen mit Dokumenten und Aktivitäten zur Inhaltserstellung genutzt werden können. Dazu gehören Newsletter, Blogbeiträge, Zusammenfassungen, Bildunterschriften usw. Microsoft gibt an, dass die Lösung Funktionen wie intelligente Dokumenten-Chat-Funktionen, Schreibhilfe, umfassende Suchfunktionen, Abfrageunterstützung, Dokumentenübersetzung und mehr unterstützt. All diese komplexen und vielfältigen Dokumentenaufgaben werden von den Modellen von OpenAI übernommen.

In einer damit verbundenen Mitteilung kündigte Microsoft an, dass das Whisper-Modell von OpenAI, ein automatisches Spracherkennungsmodell, in Kürze in Microsofts Familie von KI-Sprachdiensten und den Azure OpenAI Service integriert werden wird. Unternehmenskunden sollen damit die Möglichkeit erhalten, Audioinhalte zu transkribieren und zu übersetzen sowie Stapeltranskriptionen in größerem Umfang zu erstellen.

Neben anderen wichtigen Ankündigungen auf der Inspire erklärte Microsoft das Angebot einer öffentlichen Vorschau für Real-time Diarization, einen KI-gesteuerten Sprachdienst, der in der Lage ist, in Echtzeit zu erkennen, wer von mehreren Personen spricht. Darüber hinaus erweiterte Microsoft die Zugänglichkeit von Custom Neural Voice, einem KI-Tool, das die Stimme eines Schauspielers genau nachahmen oder synthetische Originalstimmen erstellen kann. Zuvor war der Zugang zu dieser Funktion eingeschränkt. Jetzt müssen sich die Kunden bei Microsoft bewerben und eine Genehmigung für die Nutzung dieser Funktion einholen. Außerdem müssen die Kunden die Zustimmung des Sprechers einholen und einem Verhaltenskodex zustimmen, um Custom Neural Voice nutzen zu können.

Microsoft stellt außerdem Wasserzeichen- und Erkennungstools zur Verfügung, die die Identifizierung von Audioclips erleichtern sollen, die mit Custom Neural Voice erstellt wurden. Diese Tools allein können jedoch die Lizenzierungs- und Zustimmungsprobleme im Zusammenhang mit der Technologie zum Klonen von Stimmen nicht abschließend lösen. Dennoch hat Microsoft beschlossen, sich nicht an der Auseinandersetzung in dieser Angelegenheit zu beteiligen.

Während Tools wie Vector Search und Custom Neural Voice die Tech-Welt verändern, sind Plattformen wie AppMaster, das von G2 als High Performer unter No-code Development Platforms ausgezeichnet wurde, für Nutzer interessant, die Backend-, Web- und mobile Anwendungen mit einem Minimum an Kodierung erstellen möchten. In der sich schnell verändernden Technologielandschaft wird es faszinierend sein zu sehen, wie sich die KI-Funktionen weiterentwickeln und unsere Zukunft gestalten werden.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started