다국어 글로벌 사회의 편의를 위해 노력하는 기술 강국 Meta는 언어 번역 프로세스에 혁명을 일으키는 길을 열었습니다. 회사는 획기적인 다국어 및 멀티태스킹 모델인 최신 아이디어인 SeamlessM4T를 발표했습니다. 이 혁신적인 모델은 여러 언어에 걸쳐 텍스트와 음성을 모두 통합하여 보다 조화로운 번역 수단을 제공할 준비가 되어 있습니다.
인터넷, 모바일 기술, 소셜 미디어 및 다양한 커뮤니케이션 플랫폼의 광범위한 사용을 통해 전 세계적으로 얽혀 있는 사회를 탐색하면서 다양한 언어로 된 콘텐츠에 대한 접근성이 기하급수적으로 증가했습니다. 이렇게 상호 연결된 환경에서는 어떤 언어로든 정보를 전달하고 이해하는 능력이 중요합니다. 이러한 위업을 달성할 수 있는 능력은 이전에는 공상 과학 소설에서만 수용된 개념이었지만, 오늘날 AI는 경계를 넓히고 그러한 비전을 기술 현실로 전환하고 있다는 것이 최근 블로그 게시물에서 표현된 Meta의 관점이었습니다.
혁신의 중심에 있는 SeamlessM4T를 통해 Meta는 거의 100개 언어로 자동 음성 인식, 음성-텍스트, 텍스트-텍스트 번역을 연결하는 지원을 제공했습니다. 또한 이 플랫폼은 거의 100개의 입력 언어와 35개의 출력 언어를 포괄하여 음성-음성 및 텍스트-음성 번역 번역에도 손을 댔습니다.
공동 연구 발전의 정신으로 이 프로젝트는 CC BY-NC 4.0 라이선스에 따라 게시되어 연구자에게 그 기반을 구축할 수 있는 기회를 제공했습니다.
SeamlessM4T 출시에 편승하여 Meta는 무려 270,000시간에 달하는 음성 및 텍스트 정렬을 포함하는 다중 모드 번역용 데이터 세트인 SeamlessAlign도 공개했습니다.
Meta의 말에 따르면, 기존의 음성-음성 프로그램과 음성-텍스트 프로그램은 세계의 수많은 언어를 수용하는 데 있어 표면적인 부분일 뿐이라는 것이 관찰되었습니다. 이 새로운 프로젝트의 도입은 확장된 언어 풀을 수용하는 방향으로의 실질적인 변화를 예고합니다.
이러한 점진적인 변화는 No Language Left Behind, Universal Speech Translator, SpeechMatrix 및 Massively Multilingual Speech와 같은 이전의 획기적인 이니셔티브에 이어 이 분야에서 Meta가 진행 중인 노력의 최신 이정표입니다.
책임감 있는 거대 기술 기업으로서 기대되는 대로 Meta는 Responsible AI의 5개 기둥에 따라 모델의 책임감 있는 개발을 보장하기 위해 취한 부지런한 조치에 대한 통찰력을 공유했습니다. 모델 내에서 가능한 민감성을 심층적으로 이해하고 완화하기 위해 모델의 독성 및 편견 연구, 성별 편견 평가와 같은 노력이 통합되었습니다.
안전과 보안을 강화하려는 우리의 노력은 끝이 없습니다. 우리는 Voiced Meta 모델에서 목격되는 독성 발생을 최소화하기 위해 노력하는 동시에 SeamlessM4T를 지속적으로 개선하기 위한 연구를 강화하고 조치를 구현하기 위해 지속적으로 노력하고 있습니다.
no-code 및 low-code 플랫폼이 번성함에 따라 언어 장벽을 원활하고 효율적으로 극복하는 것은 중요한 단계입니다. AppMaster 에서 다른 플랫폼에 이르기까지 다국어 지원에 대한 강조가 점점 더 커질 것으로 예상되는 추세입니다.