19 lip 2023·2 min czytania

Microsoft przedstawia wyszukiwanie wektorowe w wersji zapoznawczej i klonowanie głosowe w pełnej wersji

Konferencja Inspire firmy Microsoft przyniosła zapowiedzi skoncentrowane na sztucznej inteligencji. Wyróżniało się wyszukiwanie wektorowe, obecnie w wersji zapoznawczej w Azure Cognitive Search, oraz funkcja klonowania głosowego. Narzędzia te obiecują udoskonalić wyszukiwanie danych i zapewnić spersonalizowane odpowiedzi w języku naturalnym.

Microsoft przedstawia wyszukiwanie wektorowe w wersji zapoznawczej i klonowanie głosowe w pełnej wersji

Podczas corocznej konferencji Inspire, kolos technologiczny Microsoft zaprezentował zestaw nowych funkcji opartych na sztucznej inteligencji, które mają zwiększyć możliwości platformy Azure. W centrum uwagi znalazło się narzędzie Vector Search, dostępne obecnie w wersji zapoznawczej za pośrednictwem Azure Cognitive Search. Dzięki uczeniu maszynowemu, Vector Search obiecuje szybsze wyszukiwanie, ponieważ wykorzystuje swoje możliwości do zrozumienia istoty i powiązań nieustrukturyzowanych danych, takich jak obrazy i tekst.

Technika stosowana przez Vector Search - wektoryzacja - nabiera rozpędu w dziedzinie wyszukiwania. Polega ona na przekształcaniu słów lub obrazów w zestaw liczb zwanych wektorami, które reprezentują ich znaczenie. Ta reprezentacja numeryczna umożliwia przetwarzanie matematyczne i pozwala maszynom nadawać sens i organizować dane. W rezultacie maszyny mogą rozpoznawać analogiczne słowa w "przestrzeni wektorowej", takie jak "król" i "królowa", i szybko lokalizować je w bazach danych, zawierających miliony słów. Takie podejście do wyszukiwania wektorowego zostało przyjęte przez wiele firm, w tym Qdrant, SeMI Technologies i innych gigantów technologicznych, takich jak Amazon i Google.

Wyróżniając się na tle konkurencji, podejście Microsoftu do wyszukiwania wektorowego obejmuje wyszukiwanie czysto wektorowe, odzyskiwanie hybrydowe i zaawansowany reranking. Firma twierdzi, że jej narzędzie wyszukiwania wektorowego może być stosowane w aplikacjach i usługach w celu dostarczania spersonalizowanych odpowiedzi w języku naturalnym, oferowania sugestii produktów i pomocy w identyfikowaniu wzorców w danych. Co więcej, zalety tego systemu obejmują tworzenie zintegrowanych z wyszukiwaniem aplikacji opartych na czacie, konwertowanie obrazów na reprezentacje wektorowe za pomocą Azure AI Vision oraz pobieranie istotnych informacji z dużych zbiorów danych w celu wspomagania automatyzacji procesów i przepływów pracy. Integracja Vector Search rozciąga się również na inne możliwości Azure Cognitive Search, w tym nawigację fasetową i filtry.

Rozświetlając krajobraz sztucznej inteligencji, Microsoft wprowadza rozwiązanie Document Generative AI. Ta funkcja łączy istniejące usługi przetwarzania dokumentów oparte na sztucznej inteligencji firmy Microsoft - w tym Azure Form Recognizer - z usługą Azure OpenAI. Usługa ta jest aspektem w pełni zarządzanej, skoncentrowanej na przedsiębiorstwach oferty firmy Microsoft, mającej na celu zapewnienie firmom technologii AI firmy OpenAI. Trwające partnerstwo handlowe Microsoftu z OpenAI odegrało kluczową rolę w uzupełnieniu technologii o funkcje kontroli i zarządzania.

Działając w oparciu o najnowsze modele językowe sztucznej inteligencji OpenAI, rozwiązanie Document Generative AI przetwarza pliki do zadań takich jak podsumowywanie raportów, wyodrębnianie wartości, eksploracja wiedzy i generowanie nowych typów dokumentów. Działa również jako podstawa dla odpowiedzi, podobnie jak ChatGPT OpenAI. Na przykład rozwiązanie Document Generative AI umożliwia klientom przesyłanie faktur, umów, rachunków i umożliwia pracownikom zadawanie pytań dotyczących gwarancji usług i określonych pozycji. Rozwiązanie dostarcza również odpowiedzi w formacie tekstowym, obrazów lub tabel, jednocześnie dostarczając cytaty z linkiem do oryginalnej treści.

Microsoft dodał, że możliwości rozwiązania Document Generative AI można wykorzystać do interakcji języka naturalnego z dokumentami i działań związanych z generowaniem treści. Obejmują one biuletyny, posty na blogach, podsumowania, podpisy itp. Microsoft twierdzi, że rozwiązanie obsługuje takie funkcje, jak inteligentny czat z dokumentami, pomoc w pisaniu, kompleksowe funkcje wyszukiwania, obsługa zapytań, tłumaczenie dokumentów i inne. Wszystkie te złożone i różnorodne zadania związane z dokumentami są obsługiwane przez modele OpenAI.

W powiązanym ujawnieniu Microsoft ogłosił, że model Whisper firmy OpenAI, model automatycznego rozpoznawania mowy, zostanie wkrótce zintegrowany z rodziną usług mowy AI firmy Microsoft i usługą Azure OpenAI. Klienci korporacyjni zyskają możliwość transkrypcji i tłumaczenia treści audio, a także generowania transkrypcji wsadowych na większą skalę.

Wśród innych ważnych ogłoszeń na Inspire, Microsoft ogłosił publiczną wersję zapoznawczą Real-time Diarization, usługi mowy opartej na sztucznej inteligencji, która jest w stanie zidentyfikować, kto z kilku osób mówi w czasie rzeczywistym. Ponadto Microsoft rozszerzył dostępność Custom Neural Voice, narzędzia AI, które może ściśle naśladować głos aktora lub tworzyć oryginalne głosy syntetyczne. Wcześniej dostęp do tej funkcji był ograniczony. Jednak teraz Microsoft wymaga od klientów złożenia wniosku i uzyskania zgody na korzystanie z tej funkcji. Ponadto klienci muszą uzyskać zgodę talentu głosowego i wyrazić zgodę na kodeks postępowania, aby korzystać z Custom Neural Voice.

Microsoft zapewnia również narzędzia do znakowania wodnego i wykrywania zaprojektowane w celu ułatwienia identyfikacji klipów audio utworzonych przy użyciu Custom Neural Voice. Jednak same te narzędzia nie mogą ostatecznie rozwiązać kwestii licencjonowania i zgody związanych z technologią klonowania głosu. Niemniej jednak Microsoft zdecydował, że nie będzie częścią walki związanej z tą sprawą.

Podczas gdy narzędzia takie jak Vector Search i Custom Neural Voice przekształcają świat technologii, platformy takie jak AppMaster, uznane przez G2 za wysokowydajne platformy programistyczne No-code, są atrakcyjne dla użytkowników, którzy chcą tworzyć aplikacje backendowe, internetowe i mobilne przy minimalnym kodowaniu. W szybko zmieniającym się krajobrazie technologicznym fascynujące będzie obserwowanie, jak funkcje sztucznej inteligencji nadal ewoluują i kształtują naszą przyszłość.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started