Исследователи используют искусственный интеллект для перевода Библии на очень редкие языки

Из 7100 существующих в мире языков Библия переведена более чем на 700, что делает ее самой переводимой книгой в мире. Однако оставшиеся языки, многие из которых являются чрезвычайно редкими, десятилетиями не давали переводчикам Библии покоя. Двое ученых надеются, что новые достижения в области искусственного интеллекта помогут устранить этот пробел, сообщает Христианский Мегапортал inVictory со ссылкой на Christian Today.

«Мы хотим охватить все языки на земле; цель — охватить всех», — говорит Джоэл Мэтью, инженер-исследователь, который вместе с Ульфом Хермякобом недавно запустил проект Greek Room (Греческая комната) — технологию на основе искусственного интеллекта, призванную упростить высокотехничный процесс перевода библейских текстов.

Объединив многолетний опыт Гермьякоба в области технологий обработки естественного языка и знания Мэтью в области перевода Библии, два исследователя из Института информационных наук Университета Южной Калифорнии разработали технологию, нацеленную на «очень низкоресурсные языки, которые не входят даже в 500 лучших», — говорит Мэтью.

Знакомство двух ученых произошло в 2015 году, когда Мэтью поступил в Университет Южной Калифорнии для получения степени магистра в области компьютерных наук. Там он встретил Гермякоба в отделе искусственного интеллекта Института информационных наук. Их сблизила общая страсть к языкам и христианская вера.

Мэтью, сын переводчиков Библии, не понаслышке знает о трудностях, возникающих при ручном переводе, осуществляемом членами местной церкви. В своем родном городе, Нью-Дели, он записал все задачи, которые можно решить с помощью техники.

Проверка орфографии обычно требует большого количества людей и времени, пояснил он. В контексте перевода на редкие языки только члены местной церкви обладают достаточной квалификацией, и у них нет технологий, которые могли бы поддержать их работу.

«Это не тривиальные проблемы, это очень трудные проблемы. Но крупные компании не заинтересованы в их решении, это не их бизнес-модель — работать с редкими языками», — сказал он.

Когда Мэтью поделился с ним некоторыми проблемами, с которыми сталкиваются индийские переводчики на местах, Гермьякоб не преминул воспользоваться этим случаем.

«У меня всегда было желание узнать, как в какой-то момент я смогу применить свои навыки в своей вере», — сказал Гермякоб, получивший степень доктора философии в области компьютерных наук в Техасском университете.

В рамках своего проекта Мэтью и Хермьякоб хотят работать над языками, которые даже не имеют письменности, грамматических кодов, словарей или средств проверки орфографии.

«Мы думаем о таких языках, как уйгурский или оромо (на оромо говорят в Эфиопии и Северной Кении)», — говорит Гермякоб.

Недавно к ним обратился индийский консультант, который был заинтересован в их инструментах для перевода Библии на колами — язык, распространенный на западе Индии, который насчитывает 130 тыс. носителей.

«Greek Room также надеется изменить традиционную модель перевода Библии. Исторически сложилось так, что переводы осуществлялись западными миссионерами, которые за свою жизнь могли работать не более чем на двух языках», — пояснил Гермьякоб.

В рамках проекта Greek Room предлагается модель, основой которой являются местные церкви.

«Местные церкви и местные языковые общины просят переводить Библию на язык их сердца», — пояснил Мэтью, добавив, что в многоязычном контексте язык сердца — это язык, на котором люди выражают свои самые глубокие чувства и который обычно является их родным языком.

В первой версии Greek Room основное внимание уделяется контролю качества, чтобы переводчики могли отдавать предпочтение другим задачам, требующим более глубокого анализа, например, поиску способа перевода понятия, не существующего в данном языке. В своей следующей версии исследователи хотят, чтобы инструмент предлагал лучшие переводы.

Теперь, когда коды и данные доступны на GitHub, они надеются, что другие пользователи интегрируют их исследования в свои инструменты и будут внедрять инновации.

Их инициатива, поддержанная организацией Wycliffe Bible Translators USA (миссия переводчиков Уиклиф), является частью более широкой программы, осуществляемой организацией Every Tribe, Every Nation, которая надеется сделать Священное Писание доступным на всех языках к 2033 году.

 

INVICTORY теперь на Youtube, Instagram и Telegram!

Хотите получать самые интересные материалы прямо на свои любимые платформы? Мы готовим для вас обзоры новых фильмов, интересные подкасты, срочные новости и полезные советы от служителей на популярных платформах. Многие материалы выходят только на них, не попадая даже на сайт! Подписывайтесь и получайте самую интересную информацию первыми!