Microsoft, 벡터 검색 프리뷰 공개 및 음성 복제 정식 출시
Microsoft의 Inspire 컨퍼런스는 AI 중심의 발표를 전면에 내세웠습니다. Azure Cognitive Search에서 현재 미리 보기로 제공되는 벡터 검색과 음성 복제 기능이 눈에 띕니다. 이러한 도구는 데이터 검색을 개선하고 개인화된 자연어 응답을 제공할 것을 약속합니다.

연례 Inspire 컨퍼런스에서 거대 기술 회사 Microsoft Azure 플랫폼의 기능을 향상시킬 것으로 예상되는 일련의 새로운 AI 기반 기능을 공개했습니다. 이제 Azure Cognitive Search를 통해 미리 보기 형식으로 제공되는 벡터 검색 도구가 주목을 받았습니다. 머신 러닝을 핵심으로 하는 Vector Search는 이미지 및 텍스트와 같은 비정형 데이터의 본질과 관련성을 파악하는 기능을 활용하여 더 빠른 검색 경험을 약속합니다.
벡터 검색에 사용되는 기술인 벡터화는 검색 분야에서 추진력을 얻고 있습니다. 여기에는 단어나 이미지를 의미를 나타내는 벡터라고 하는 일련의 숫자로 변환하는 작업이 포함됩니다. 이 숫자 표현은 수학적 처리를 허용하고 기계가 데이터를 이해하고 구성할 수 있도록 합니다. 결과적으로 기계는 '벡터 공간' 내에서 '왕' 및 '여왕'과 같은 유사한 단어를 인식하고 수백만 단어로 구성된 데이터베이스 내에서 신속하게 찾을 수 있습니다. 벡터 검색에 대한 이러한 접근 방식은 Qdrant, SeMI Technologies 및 Amazon 및 Google과 같은 기타 기술 거대 기업을 포함한 많은 회사에서 채택되었습니다.
경쟁사와 차별화하기 위해 Microsoft의 벡터 검색 접근 방식에는 순수 벡터 검색, 하이브리드 복구 및 고급 순위 재지정이 포함됩니다. 이 회사는 벡터 검색 도구를 앱과 서비스에 사용하여 자연어로 개인화된 응답을 제공하고 제품 제안을 제공하며 데이터의 패턴을 식별할 수 있다고 가정합니다. 또한 이 시스템의 이점에는 검색 통합 채팅 기반 앱 구축, Azure AI Vision을 사용하여 이미지를 벡터 표현으로 변환, 대규모 데이터 세트에서 관련 정보를 검색하여 프로세스 및 워크플로 자동화를 지원하는 것이 포함됩니다. 벡터 검색의 통합은 패싯 탐색 및 필터 중에서 다른 Azure Cognitive Search 기능으로 더욱 확장됩니다.
AI 환경을 더욱 조명하는 Microsoft는 Document Generative AI 솔루션을 출시하고 있습니다. 이 기능은 Azure Form Recognizer를 비롯한 Microsoft의 기존 AI 기반 문서 처리 서비스를 Azure OpenAI 서비스와 통합합니다. 이 서비스는 기업에 OpenAI의 AI 기술을 제공하기 위한 Microsoft의 완전 관리형 엔터프라이즈 중심 제품의 한 측면입니다. OpenAI와 Microsoft의 지속적인 상업적 파트너십은 기술에 제어 및 거버넌스 기능을 보완하는 데 중요한 역할을 했습니다.
OpenAI의 최신 AI 언어 모델에 따라 작동하는 Document Generative AI 솔루션은 보고서 요약, 값 추출, 지식 마이닝, 새로운 유형의 문서 생성과 같은 작업을 위해 파일을 처리합니다. 또한 OpenAI의 ChatGPT와 유사하게 응답의 기반 역할을 합니다. 예를 들어 Document Generative AI 솔루션을 사용하면 고객이 송장, 계약서, 청구서를 업로드하고 직원이 서비스 보증 및 특정 라인 항목에 대해 쿼리할 수 있습니다. 이 솔루션은 또한 텍스트 형식, 이미지 또는 표로 답변을 제공하는 동시에 원본 콘텐츠에 대한 링크가 있는 인용문을 제공합니다.
Microsoft는 Document Generative AI 솔루션의 기능을 문서 및 콘텐츠 생성 활동과의 자연어 상호 작용에 활용할 수 있다고 덧붙였습니다. 여기에는 뉴스레터, 블로그 게시물, 요약, 캡션 등이 포함됩니다. Microsoft는 솔루션이 지능형 문서 채팅 기능, 쓰기 지원, 포괄적인 검색 기능, 쿼리 지원, 문서 번역 등과 같은 기능을 지원한다고 밝혔습니다. 이 모든 복잡하고 다양한 문서 작업은 OpenAI의 모델에서 처리됩니다.
Microsoft는 연결된 공개에서 자동 음성 인식 모델인 OpenAI의 Whisper 모델이 곧 Microsoft의 AI 음성 서비스 제품군 및 Azure OpenAI 서비스에 통합될 것이라고 발표했습니다. 기업 고객은 오디오 콘텐츠를 전사하고 번역할 수 있을 뿐만 아니라 더 큰 규모로 배치 전사를 생성할 수 있습니다.
Inspire의 다른 주요 발표 중 Microsoft는 여러 사람 중 누가 실시간으로 말하고 있는지 식별할 수 있는 AI 기반 음성 서비스인 Real-time Diarization에 대한 공개 미리 보기를 제공한다고 선언했습니다. 또한 마이크로소프트는 연기자의 목소리를 거의 흉내내거나 원래의 합성 음성을 생성할 수 있는 AI 도구인 Custom Neural Voice의 접근성을 넓혔습니다. 이전에는 이 기능에 대한 액세스가 제한되었습니다. 그러나 Microsoft는 이제 고객이 이 기능을 사용하려면 신청하고 승인을 받아야 합니다. 또한 고객이 Custom Neural Voice를 사용하려면 성우의 동의를 얻고 행동 강령에 동의해야 합니다.
Microsoft는 또한 Custom Neural Voice를 사용하여 만든 오디오 클립을 쉽게 식별할 수 있도록 설계된 워터마크 및 감지 도구를 제공합니다. 그러나 이러한 도구만으로는 음성 복제 기술과 관련된 라이선스 및 동의 문제를 결정적으로 해결할 수 없습니다. 그럼에도 불구하고 Microsoft는 이 문제와 관련된 싸움에 참여하지 않기로 결정했습니다.
Vector Search 및 Custom Neural Voice와 같은 도구가 기술 세계를 변화시키는 동안 G2에서 No-code 개발 플랫폼에서 고성능으로 인정받은 AppMaster 와 같은 플랫폼은 최소한의 코딩으로 백엔드, 웹 및 모바일 애플리케이션을 만들려는 사용자에게 매력적입니다. . 빠르게 변화하는 기술 환경에서 AI 기능이 어떻게 계속 진화하고 우리의 미래를 형성하는지 보는 것은 흥미로울 것입니다.


