Meta представляет SeamlessM4T — новаторский многоязычный искусственный перевод текста и речи
С целью облегчить оптимальное общение в многоязычном мире Meta представляет SeamlessM4T.

Стремясь к лучшему в нашем многоязычном глобальном обществе, технологическая компания Meta проложила путь к революционному преобразованию процесса языковых переводов. Компания анонсировала свое последнее детище, SeamlessM4T, революционную многоязычную и многозадачную модель. Эта инновационная модель призвана обеспечить более гармонизированные средства перевода, охватывающие несколько языков и включающие как текст, так и речь.
В нашем глобально переплетенном обществе, что стало возможным благодаря широкому использованию Интернета, мобильных технологий, социальных сетей и разнообразных коммуникационных платформ, доступность контента на разных языках возросла в геометрической прогрессии. В такой взаимосвязанной среде решающее значение приобретает способность общаться и понимать информацию на любом языке. Хотя способность достичь такого результата раньше была концепцией, охватывающей исключительно научную фантастику, сегодня ИИ раздвигает границы и превращает такие видения в техническую реальность, такова точка зрения Меты, выраженная в недавнем сообщении в блоге.
Благодаря SeamlessM4T, возглавляющему инновации, Meta предложила поддержку автоматического распознавания речи, объединяя переводы из речи в текст и из текста в текст почти на 100 языках. Кроме того, платформа также занимается переводом речи в речь и текста в речь, охватывая почти 100 языков ввода и 35 языков вывода.
В духе совместных исследований проект был опубликован под лицензией CC BY-NC 4.0, что дало исследователям возможность развивать его основу.
Вслед за запуском SeamlessM4T Meta также опубликовала SeamlessAlign, набор данных для мультимодального перевода, который включает в себя ошеломляющие 270 000 часов выравнивания речи и текста.
По словам Меты, было замечено, что существующие программы преобразования речи в речь и речи в текст лишь поверхностно приспосабливаются к множеству мировых языков. Внедрение этого нового проекта знаменует собой существенный сдвиг в сторону обслуживания расширенного пула языков.
Этот прогрессивный сдвиг является последней вехой в текущих усилиях Meta в этой области после предыдущих новаторских инициатив, таких как No Language Left Behind, Universal Speech Translator, SpeechMatrix и Massically Multilingual Speech.
Как и ожидалось от ответственного технологического гиганта, Мета поделилась информацией о тщательных шагах, предпринятых для обеспечения ответственного развития модели в соответствии с пятью столпами ответственного ИИ. Такие усилия, как исследование токсичности и предвзятости, а также оценка гендерной предвзятости модели, включены для более глубокого понимания и смягчения возможной чувствительности в модели.
Наша приверженность укреплению безопасности и защиты непоколебима. Мы настойчиво стремимся расширять исследования и реализовывать меры по постоянному совершенствованию SeamlessM4T, стремясь при этом свести к минимуму случаи токсичности, наблюдаемые в модели, озвученной Метой.
Поскольку платформы no-code и low-code процветают, плавное и эффективное преодоление языковых барьеров является важным шагом. От AppMaster до других платформ акцент на многоязычной поддержке является растущей тенденцией, которая, как ожидается, только усилится.


