'
Ростовская М.Д.
СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА *
Аннотация:
информационный технологии непрерывно развиваются, возникают комплексные и сложные программы, такие как нейронные сети, которые постепенно входят в различные аспекты человеческой жизнедеятельности. Имитируя работу сознания человека, они позволяют писать тексты, создавать изображения, видео, программы и многое другое. Наряду с этим развивается и машинный перевод, который важен не только в контексте жизни специалиста-переводчика, но и в быту обычного человека. В статье будет рассматриваться состояние машинного перевода в наши дни
Ключевые слова:
машинный перевод, автоматический перевод, корпусная лингвистика, нейросеть
УДК 81.33
Ростовская М.Д.
магистрант,
кафедра Иностранных языков и перевода,
Уральский гуманитарный институт
Уральский федеральный университет
имени первого Президента России Б.Н. Ельцина
(г. Екатеринбург, Россия)
СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ
РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА
Аннотация: информационный технологии непрерывно развиваются, возникают комплексные и сложные программы, такие как нейронные сети, которые постепенно входят в различные аспекты человеческой жизнедеятельности. Имитируя работу сознания человека, они позволяют писать тексты, создавать изображения, видео, программы и многое другое. Наряду с этим развивается и машинный перевод, который важен не только в контексте жизни специалиста-переводчика, но и в быту обычного человека. В статье будет рассматриваться состояние машинного перевода в наши дни.
Ключевые слова: машинный перевод, автоматический перевод, корпусная лингвистика, нейросеть.
История машинного перевода начинается с 1950-х годов, с применения словарного подхода, позволившего получать простой дословный перевод. В 1990-е годы с развитием корпусной лингвистики, основанной на примерах, сборе и хранении правильных переводов, машинный перевод начал совершенствоваться и давать более точные результаты [6, p. 92]. В настоящее время в развитии машинного перевода все большую роль начинают играть разработки в области искусственного интеллекта.
Актуальным предметом изучения остаются подходы к машинному переводу, их преимущества и недостатки. Исследователи в области подходов к машинному переводу работают над развитием гибридного подхода, который смог бы сочетать сильные стороны уже используемых инструментов: подход, основанный на грамматических правилах, корпусный подход, направленный на формирование баз с источниками данных, и статистический поход, сутью которого является использование программой большого количества параллельных текстов на разных языках [5, p. 165]. Совершенствование машинного перевода имеет комплексный характер, наблюдается тенденция усложнения и слияния нескольких подходов к машинному переводу для получения более точных результатов. Так, например, «Яндекс-переводчик», по словам одного из разработчиков Антона Дворковича, еще с сентября 2017 года отказался от использования статистической модели перевода в пользу гибрида на основе нейросетей [2].
Принципиальной особенностью нейросетевого подхода к машинному переводу является использование контекста всего исходного предложения для перевода, что позволяет получить более качественный результат. Высокая скорость графических процессоров и использование преимуществ параллелизма позволяют эффективно справляться с большим количеством задач при машинном переводе [1].
Кроме того, с усилением интереса к нейросетям, появляются совершенно новые разработки в области машинного перевода. Исследователями Массачусетского технологического института и Калифорнийского университета в Сан-Диего разрабатывается новая модель машинного перевода под названием VALHALLA, которая должна работать по принципу связи текста и ассоциативного изображения [3]. Работу такой модели можно представить следующим образом: специальная нейронная сеть сначала видит исходное предложение на одном языке, проецирует образ того, как оно может выглядеть, а затем использует эти данные для перевода на целевой язык. Команда обнаружила, что такой метод демонстрирует более высокую точность машинного перевода по сравнению с обычным переводом текста.
Однако, несмотря на прогресс в сфере машинного перевода, здесь остается ряд проблем, решить которые до сих пор трудно. Во-первых, это перевод на морфологически богатые языки, такие как финский, арабский, немецкий: многие системы машинного перевода в силу недостатка баз данных не могут генерировать незнакомые им словоформы [4, p. 2].
Во-вторых, это перевод речи: содержание и качество устной речи значительно отличается от того, что может предложить машинный перевод в рамках подхода, доминирующее значение в котором имеет опора на существующие шаблоны и примеры [4, p. 2].
В-третьих, это перевод поэтических текстов, где автоматический перевод особенно проявляет свою слабую сторону. Тексты, изобилующие художественной образностью, теряют при автоматическом переводе зачастую не только свой ритмический рисунок, но и смысл, потому что машина выбирает не подходящую по значению переводческую единицу. Актуальной проблемой остается перевод образных выражений, таких как идиомы и пословицы, потому что машинный перевод зачастую предоставляет дословный и буквальный перевод таких выражений. Например, в песне группы Queen «We are the champions» есть строчка, в которой используется идиома «no bed of roses», означающая нелегкую жизнь, непростой опыт. Строчку «but it's been no bed of roses» можно перевести как «но это было нелегко», в некоторых поэтических переводах встречается вариант «борьба была нелегкой», однако крупные системы машинного перевода продолжают выдавать дословный перевод. Результат Google-переводчика: «но это не было розовым ложем», результат Яндекс-переводчика: «но это не было ложе из роз». Машинам все еще трудно считывать метафоры и видеть глубинный смысл таких высказываний.
Также актуальной проблемой остается нехватка данных для обучения машин перевода: требуется огромное количество предложений на языке оригинала и перевода, структурированных по парам предложений, причем, эти примеры должны быть разнообразны по контексту. Особенно остро такая проблема стоит для редких языков и языков со сложной письменностью.
Таким образом, в области автоматизированного перевода появляются новые вызовы, связанные с нехваткой данных для качественного обучения машин. Тем не менее, с появлением новых технологий, таких как нейросети, машинный перевод стремительно меняется и, благодаря новым подходам и методам, выдает все более точные результаты, приближенные к работе реального переводчика.
СПИСОК ЛИТЕРАТУРЫ:
Номер журнала Вестник науки №6 (63) том 3
Ссылка для цитирования:
Ростовская М.Д. СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА // Вестник науки №6 (63) том 3. С. 804 - 808. 2023 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/9075 (дата обращения: 18.05.2024 г.)
Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2023. 16+
*