19 lug 2023·2 min di lettura

Microsoft presenta la ricerca vettoriale in anteprima e la clonazione vocale in versione completa

La conferenza Inspire di Microsoft ha portato alla ribalta annunci incentrati sull'intelligenza artificiale. Spiccano la ricerca vettoriale, ora in anteprima in Azure Cognitive Search, e la funzione di clonazione vocale. Questi strumenti promettono di perfezionare la ricerca dei dati e di fornire risposte personalizzate in linguaggio naturale.

Microsoft presenta la ricerca vettoriale in anteprima e la clonazione vocale in versione completa

Durante la conferenza annuale Inspire, il colosso tecnologico Microsoft ha presentato una serie di nuove funzionalità basate sull'intelligenza artificiale che dovrebbero migliorare le capacità della sua piattaforma Azure. I riflettori erano puntati sullo strumento Vector Search, ora disponibile in anteprima tramite Azure Cognitive Search. Grazie all'apprendimento automatico, Vector Search promette un'esperienza di ricerca più rapida, in quanto sfrutta le sue capacità di comprendere l'essenza e la correlazione di dati non strutturati, come immagini e testi.

La tecnica utilizzata da Vector Search - la vettorializzazione - sta guadagnando terreno nel campo della ricerca. Essa prevede la trasformazione di parole o immagini in un insieme di numeri, detti vettori, rappresentativi del loro significato. Questa rappresentazione numerica consente l'elaborazione matematica e permette alle macchine di dare un senso ai dati e di organizzarli. Di conseguenza, le macchine possono riconoscere parole analoghe all'interno dello "spazio vettoriale", come "re" e "regina", e localizzarle prontamente all'interno di database che comprendono milioni di parole. Questo approccio alla ricerca vettoriale è stato adottato da molte aziende, tra cui Qdrant, SeMI Technologies, e altri giganti della tecnologia come Amazon e Google.

Per differenziarsi dalla concorrenza, l'approccio di Microsoft alla ricerca vettoriale comprende la ricerca vettoriale pura, il recupero ibrido e il reranking avanzato. L'azienda sostiene che il suo strumento di ricerca vettoriale può essere impiegato in applicazioni e servizi per fornire risposte personalizzate in linguaggio naturale, offrire suggerimenti sui prodotti e aiutare a identificare modelli nei dati. Inoltre, i vantaggi di questo sistema includono la creazione di app integrate nella ricerca e basate su chat, la conversione di immagini in rappresentazioni vettoriali con Azure AI Vision e il recupero di informazioni rilevanti da grandi insiemi di dati per favorire l'automazione dei processi e dei flussi di lavoro. L'integrazione di Vector Search si estende ulteriormente ad altre funzionalità di Azure Cognitive Search, tra cui la navigazione a faccette e i filtri.

Per illuminare ulteriormente il panorama dell'AI, Microsoft sta lanciando la soluzione Document Generative AI. Questa funzionalità unisce i servizi di elaborazione dei documenti basati sull'intelligenza artificiale già esistenti in Microsoft, tra cui Azure Form Recognizer, con Azure OpenAI Service. Questo servizio è un aspetto dell'offerta Microsoft completamente gestita e incentrata sulle imprese, che mira a fornire alle aziende la tecnologia AI di OpenAI. La partnership commerciale in corso tra Microsoft e OpenAI è stata determinante per integrare le funzioni di controllo e governance della tecnologia.

Basandosi sui più recenti modelli linguistici di intelligenza artificiale di OpenAI, la soluzione Document Generative AI elabora i file per attività quali la sintesi di rapporti, l'estrazione di valori, l'estrazione di conoscenze e la generazione di nuovi tipi di documenti. Funge anche da base per le risposte, in modo simile a ChatGPT di OpenAI. Ad esempio, la soluzione Document Generative AI consente ai clienti di caricare fatture, contratti, bollette e ai dipendenti di chiedere informazioni sulle garanzie di servizio e su voci specifiche. La soluzione fornisce anche risposte in formato testo, immagini o tabelle, fornendo al contempo citazioni con un link al contenuto originale.

Microsoft ha aggiunto che le funzionalità della soluzione Document Generative AI possono essere sfruttate per interazioni in linguaggio naturale con documenti e attività di generazione di contenuti. Queste includono newsletter, post di blog, riassunti, didascalie, ecc. Microsoft afferma che la soluzione supporta funzioni come la chat intelligente sui documenti, l'assistenza alla scrittura, la funzionalità di ricerca completa, il supporto alle query, la traduzione dei documenti e altro ancora. Tutti questi compiti complessi e diversificati sono gestiti dai modelli di OpenAI.

In una comunicazione collegata, Microsoft ha annunciato che il modello Whisper di OpenAI, un modello di riconoscimento vocale automatico, sarà presto integrato nella famiglia di servizi vocali AI di Microsoft e nel servizio OpenAI di Azure. I clienti aziendali avranno la possibilità di trascrivere e tradurre contenuti audio e di generare trascrizioni in batch su larga scala.

Tra gli altri annunci più importanti di Inspire, Microsoft ha dichiarato l'offerta di un'anteprima pubblica per Real-time Diarization, un servizio vocale basato sull'intelligenza artificiale in grado di identificare chi tra più persone sta parlando in tempo reale. Inoltre, Microsoft ha ampliato l'accessibilità di Custom Neural Voice, uno strumento di intelligenza artificiale in grado di imitare fedelmente la voce di un attore o di creare voci sintetiche originali. In precedenza, l'accesso a questa funzione era limitato. Tuttavia, ora Microsoft richiede ai clienti di fare domanda e ottenere l'approvazione per utilizzare la funzione. Inoltre, per utilizzare Custom Neural Voice i clienti devono ottenere il consenso del cantante e accettare un codice di condotta.

Microsoft fornisce anche strumenti di watermarking e di rilevamento progettati per facilitare l'identificazione delle clip audio create con Custom Neural Voice. Tuttavia, questi strumenti da soli non possono risolvere in modo definitivo i problemi di licenza e di consenso associati alla tecnologia di clonazione vocale. Ciononostante, Microsoft ha deciso di non prendere parte alla lotta associata a questo problema.

Mentre strumenti come Vector Search e Custom Neural Voice stanno trasformando il mondo tecnologico, piattaforme come AppMaster, riconosciuta da G2 come High Performer in No-code Development Platforms, attraggono gli utenti che desiderano creare applicazioni backend, web e mobile con un minimo di codifica. Nel panorama tecnologico in rapida evoluzione, sarà affascinante vedere come le funzionalità AI continueranno a evolversi e a plasmare il nostro futuro.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started