Компания Meta разработала модель ИИ с использованием текста Писаний на разных языках

Компания Meta выложила в открытый доступ модель искусственного интеллекта Massively Multilingual Speech (MMS), которая распознаёт разговорную речь на 4000 языках и воспроизводит её, то есть преобразует текст в речь более чем на 1100 языках.Для обучения моделей разработчики использовали Библию и  Новый Завет, так как эта книга переведена на самое большое количество языков, сообщает Христианский Мегапортал inVictory со ссылкой на engadget.com.

В компании рассказали, что на основе Библии создали два датасета. В рамках проекта MMS был создан набор данных о прочтении Нового Завета на более чем 1100 языках, что обеспечило в среднем 32 часа данных на каждый язык.

Изучая немаркированные записи различных других книг Библии, количество доступных языков было увеличил до более чем 4000.  В компании признали, что содержание аудиозаписей, которым обучали ИИ является религиозным. Но несмотря на содержание обучающих материалов, у обученной на этих текстах модели не появилось уклона в сторону религиозного мировоззрения; не возникло и гендерного перекоса, хотя большинство взятых за образец аудиозаписей зачитывали мужчины. Проблему с отсутствием текстовой разметки у аудиозаписей удалось преодолеть за счёт wav2vec 2.0 — ещё одной ИИ-модели Meta, предназначенной для «обучения представлению речи с самоконтролем».

В компании предупредили, что результат может быть не идеальным — есть риск, что модель преобразования речи в текст могла неверно интерпретировать некоторые слова и фразы, и в некоторых контекстах такие ошибки порой носят оскорбительный характер. Но на практике, утверждают разработчики, MMS демонстрирует вдвое меньше ошибок, чем существующие аналоги, включая модель OpenAI Whisper, и поддерживает в 11 раз больше языков.

На практике проект откроет носителям редких языков доступ к информации и технологическим продуктам — большинство сервисов современных технологических гигантов ограничено набором в 100 языков, и такое положение вещей в Meta считают неприемлемым.

Meta Platforms, Inc американская транснациональная холдинговая компания, являющаяся материнской организацией Facebook, Instagram, WhatsApp, Oculus и ещё около 30 дочерних компаний.  Одна из самых дорогих компаний в мире.

 

INVICTORY теперь на Youtube, Instagram и Telegram!

Хотите получать самые интересные материалы прямо на свои любимые платформы? Мы готовим для вас обзоры новых фильмов, интересные подкасты, срочные новости и полезные советы от служителей на популярных платформах. Многие материалы выходят только на них, не попадая даже на сайт! Подписывайтесь и получайте самую интересную информацию первыми!