'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №6 (63) том 3
  4. Научная статья № 130

Просмотры  69 просмотров

Ростовская М.Д.

  


СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА *

  


Аннотация:
информационный технологии непрерывно развиваются, возникают комплексные и сложные программы, такие как нейронные сети, которые постепенно входят в различные аспекты человеческой жизнедеятельности. Имитируя работу сознания человека, они позволяют писать тексты, создавать изображения, видео, программы и многое другое. Наряду с этим развивается и машинный перевод, который важен не только в контексте жизни специалиста-переводчика, но и в быту обычного человека. В статье будет рассматриваться состояние машинного перевода в наши дни   

Ключевые слова:
машинный перевод, автоматический перевод, корпусная лингвистика, нейросеть   


УДК 81.33

Ростовская М.Д.

магистрант,

кафедра Иностранных языков и перевода,

Уральский гуманитарный институт

Уральский федеральный университет

имени первого Президента России Б.Н. Ельцина

(г. Екатеринбург, Россия)

 

СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ

РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

 

Аннотация: информационный технологии непрерывно развиваются, возникают комплексные и сложные программы, такие как нейронные сети, которые постепенно входят в различные аспекты человеческой жизнедеятельности. Имитируя работу сознания человека, они позволяют писать тексты, создавать изображения, видео, программы и многое другое. Наряду с этим развивается и машинный перевод, который важен не только в контексте жизни специалиста-переводчика, но и в быту обычного человека. В статье будет рассматриваться состояние машинного перевода в наши дни.

 

Ключевые слова: машинный перевод, автоматический перевод, корпусная лингвистика, нейросеть.

 

История машинного перевода начинается с 1950-х годов, с применения словарного подхода, позволившего получать простой дословный перевод. В 1990-е годы с развитием корпусной лингвистики, основанной на примерах, сборе и хранении правильных переводов, машинный перевод начал совершенствоваться и давать более точные результаты [6, p. 92]. В настоящее время в развитии машинного перевода все большую роль начинают играть разработки в области искусственного интеллекта.

Актуальным предметом изучения остаются подходы к машинному переводу, их преимущества и недостатки. Исследователи в области подходов к машинному переводу работают над развитием гибридного подхода, который смог бы сочетать сильные стороны уже используемых инструментов: подход, основанный на грамматических правилах, корпусный подход, направленный на формирование баз с источниками данных, и статистический поход, сутью которого является использование программой большого количества параллельных текстов на разных языках [5, p. 165]. Совершенствование машинного перевода имеет комплексный характер, наблюдается тенденция усложнения и слияния нескольких подходов к машинному переводу для получения более точных результатов. Так, например, «Яндекс-переводчик», по словам одного из разработчиков Антона Дворковича, еще с сентября 2017 года отказался от использования статистической модели перевода в пользу гибрида на основе нейросетей [2].

Принципиальной особенностью нейросетевого подхода к машинному переводу является использование контекста всего исходного предложения для перевода, что позволяет получить более качественный результат. Высокая скорость графических процессоров и использование преимуществ параллелизма позволяют эффективно справляться с большим количеством задач при машинном переводе [1].

Кроме того, с усилением интереса к нейросетям, появляются совершенно новые разработки в области машинного перевода. Исследователями Массачусетского технологического института и Калифорнийского университета в Сан-Диего разрабатывается новая модель машинного перевода под названием VALHALLA, которая должна работать по принципу связи текста и ассоциативного изображения [3]. Работу такой модели можно представить следующим образом: специальная нейронная сеть сначала видит исходное предложение на одном языке, проецирует образ того, как оно может выглядеть, а затем использует эти данные для перевода на целевой язык. Команда обнаружила, что такой метод демонстрирует более высокую точность машинного перевода по сравнению с обычным переводом текста.

Однако, несмотря на прогресс в сфере машинного перевода, здесь остается ряд проблем, решить которые до сих пор трудно. Во-первых, это перевод на морфологически богатые языки, такие как финский, арабский, немецкий: многие системы машинного перевода в силу недостатка баз данных не могут генерировать незнакомые им словоформы [4, p. 2].

Во-вторых, это перевод речи: содержание и качество устной речи значительно отличается от того, что может предложить машинный перевод в рамках подхода, доминирующее значение в котором имеет опора на существующие шаблоны и примеры [4, p. 2].

В-третьих, это перевод поэтических текстов, где автоматический перевод особенно проявляет свою слабую сторону. Тексты, изобилующие художественной образностью, теряют при автоматическом переводе зачастую не только свой ритмический рисунок, но и смысл, потому что машина выбирает не подходящую по значению переводческую единицу. Актуальной проблемой остается перевод образных выражений, таких как идиомы и пословицы, потому что машинный перевод зачастую предоставляет дословный и буквальный перевод таких выражений. Например, в песне группы Queen «We are the champions» есть строчка, в которой используется идиома «no bed of roses», означающая нелегкую жизнь, непростой опыт. Строчку «but it's been no bed of roses» можно перевести как «но это было нелегко», в некоторых поэтических переводах встречается вариант «борьба была нелегкой», однако крупные системы машинного перевода продолжают выдавать дословный перевод. Результат Google-переводчика: «но это не было розовым ложем», результат Яндекс-переводчика: «но это не было ложе из роз». Машинам все еще трудно считывать метафоры и видеть глубинный смысл таких высказываний.

Также актуальной проблемой остается нехватка данных для обучения машин перевода: требуется огромное количество предложений на языке оригинала и перевода, структурированных по парам предложений, причем, эти примеры должны быть разнообразны по контексту. Особенно остро такая проблема стоит для редких языков и языков со сложной письменностью.

Таким образом, в области автоматизированного перевода появляются новые вызовы, связанные с нехваткой данных для качественного обучения машин. Тем не менее, с появлением новых технологий, таких как нейросети, машинный перевод стремительно меняется и, благодаря новым подходам и методам, выдает все более точные результаты, приближенные к работе реального переводчика.

 

СПИСОК ЛИТЕРАТУРЫ:

 

  1. Машинный перевод 21 века: доступная фантастика. Интервью с Юлией Епифанцевой. URL: https://www.tadviser.ru/a/568603 (дата обращения: 01.06.2023)
  2. Удинцев Н. Почему нейросеть-переводчик придумывает новые слова. URL: https://daily.afisha.ru/brain/7554-obonyat-lesbiyachestvo-pochemu-neyroset-perevodchik-pridumyvaet-novye-slova/ (дата обращения: 01.06.2023)
  3. Hinkel L. Hallucinating to better text translation URL: https://news.mit.edu/2022/hallucinating-better-text-translation-0606?hss_channel=lis-oCknw3BEJc (дата обращения: 01.06.2023)
  4. Lopez A., Post M. Beyond bitext: Five open problems in machine translation // Proceedings of the EMNLP workshop on twenty years of Bitext. – 2013. – P. 1-3.
  5. Okpor M. D. Machine translation approaches: issues and challenges // International Journal of Computer Science Issues (IJCSI). – 2014. – Vol. 11. – №. 5. – P. 159-165.
  6. Zheng H. A case study of machine translation: Problems and suggestions // International Journal of English Linguistics. – 2015. – Vol. 5. – №. 2. – P. 92-99.
  


Полная версия статьи PDF

Номер журнала Вестник науки №6 (63) том 3

  


Ссылка для цитирования:

Ростовская М.Д. СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА // Вестник науки №6 (63) том 3. С. 804 - 808. 2023 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/9075 (дата обращения: 17.05.2024 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/9075



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2023.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.