![]() |
|
сделать стартовой | добавить в избранное |
![]() |
Промышленность и Производство
Техника
История машинного перевода |
История машинного перевода Е. Н. Филинов Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить (см. Апокин и др. Чарльз Бэббидж. М., Наука, 1981). Фактически история машинного перевода начинается с "Джорджтаунского эксперимента". В январе 1954 г. состоялась первая публичная демонстрация машинного перевода с русского языка на английский, осуществленного на машине ИБМ-701. Сообщение об этом событии было опубликовано в журнале Compu ers a d Au oma io , 1954, № 2. А реферат этого сообщения, сделанный Д. Ю. Пановым, появился в РЖ ВИНИТИ "Математика", 1954, № 10: "Перевод с одного языка на другой при помощи машины: отчет о первом успешном испытании". Это сообщение явилось толчком для начала работ по машинному переводу в СССР. Д. Ю. Панов, бывший тогда директором ВИНИТИ (в то время Института научной информации - ИНИ) привлек к работам по машинному переводу И. К. Бельскую, которая затем возглавила группу машинного перевода в ИТМ и ВТ АН СССР. Первый опыт перевода с английского языка на русский с помощью машины БЭСМ был получен уже к концу 1955 г. Программы для БЭСМ составляли Н. П. Трифонов и Л. Н. Королев, кандидатская диссертация которого была посвящена методам построения словарей для машинного перевода. Другое направление работ возникло в Отделении прикладной математики Математического института АН СССР (ныне ИПМ им. М. В. Келдыша РАН) по инициативе А. А. Ляпунова. К работам по машинному переводу математических текстов с французского языка на русский он привлек О. С. Кулагину, аспирантку МИАН, своих учениц Т. Д. Вентцель и Н. Н. Рикко. С конца 1955 г. в этих работах принимала участие Т. Н. Молошная, которая затем приступила к самостоятельной работе над алгоритмом англо-русского перевода. А. А. Ляпунов и О. С. Кулагина свои представления об использовании вычислительных машин для перевода с одного языка на другой опубликовали в журнале "Природа",1955, № 8. Первые программы машинного перевода, разработанные этим коллективом, были реализованы на машине "Стрела". Первое поколение систем машинного перевода базировалось на алгоритмах последовательного перевода "слово за словом", "фраза за фразой". Возможности таких систем определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Перевод текста осуществлялся отдельными предложениями, смысловые связи между ними никак не учитывались. Такие системы называют системами прямого перевода. На смену им со временем пришли системы последующих поколений, в которых перевод от языка к языку осуществлялся на уровне синтаксических структур.
В алгоритмах перевода использовался набор операций, позволяющий путем анализа переводимого предложения построить его синтаксическую структуру по правилам грамматики языка входного предложения (так же, как учат детей языку в средней школе), а затем преобразовать ее в синтаксическую структуру выходного предложения и синтезировать выходное предложение, подставляя нужные слова из словаря. Такие системы называются Т-системами (Т - от английского слова " ra sfer - преобразование"). Наиболее совершенным считается подход к построению систем машинного перевода на основе получения некоторого, независимого от языков, смыслового представления входного предложения путем его семантического анализа. Затем производится синтез выходного предложения по полученному смысловому представлению. Такие системы называют И-системами (И - от слова "интерлингва"). Считается, что следующие поколения систем машинного перевода будут относиться к классу И-систем. Как большой ученый, которому свойственно видеть всю проблему в целом, А. А. Ляпунов с самого начала работ по машинному переводу говорил о переводе путем извлечения смысла переводимого текста и его представления на другом языке. Однако такая постановка проблемы перевода оказалась в то время преждевременной. Более того, она не решена в общем виде мировой информатикой и в настоящее время, несмотря на усилия, предпринимавшиеся Международной федерацией IFIP - мировым сообществом ученых в области обработки информации. Однако многие частные результаты, связанные с семантическим анализом текстов, были получены и опубликованы в трудах IFIP. Первый опыт создания программ машинного перевода показал, что необходимо решать эти задачи постепенно и по частям. Слишком много трудностей и неясностей было в том, как нужно формализовать и строить алгоритмы для работы с текстами, какие словари надо вводить в машину, какие лингвистические закономерности следует использовать при машинном переводе и каковы вообще эти закономерности. Выяснилось, что традиционная лингвистика не располагает ни фактическим материалом, ни идеями и представлениями, нужными для построения систем машинного перевода, которые использовали бы смысл переводимого текста. Традиционная лингвистика не могла дать исходные представления не только в части семантики, но и в части синтаксиса. Ни для одного языка в то время не существовало перечней синтаксических конструкций, не были изучены условия их сочетаемости и взаимозаменяемости, не были разработаны правила построения крупных единиц синтаксической структуры из более мелких. В сущности ни на один вопрос, поставленный в связи с построением систем машинного перевода, традиционная лингвистика в 50-х годах не могла дать ответа. Потребность в создании теоретических основ машинного перевода привела к формированию нового направления в лингвистике, называемого структурной, прикладной, математической лингвистикой. Формирование этого направления в СССР относится ко второй половине 50-х годов. Ведущую роль в нем сыграли математики А. А. Ляпунов, В. А. Успенский, (ученик А. Н. Колмогорова), О. С. Кулагина, лингвисты В.
Ю. Розенцвейг, П. С. Кузнецов, А. А. Реформатский, И. А. Мельчук, В. В. Иванов. 6 мая 1960 г. было принято Постановление Президиума АН СССР "О развитии структурных и математических методов исследования языка", во исполнение которого были созданы подразделения по структурной лингвистике в Институте языкознания, Институте русского языка АН СССР. В Постановлении Президиума АН СССР отмечалось, что "недостаточное развитие теоретических исследований в области структурных и математических методов в лингвистических учреждениях тормозит практически важные работы по теории и практике машинного перевода, построению информационных языков и информационных машин, логической семантике и другим приложениям языкознания, разрабатываемым в настоящее время в ряде технических и математических научно-исследовательских институтов". С 1960 г. началась подготовка кадров в области автоматической переработки текстов на филологическом факультете МГУ, в Ленинградском и Новосибирском университетах, МГПИИЯ. Под математической лингвистикой понималось изучение языка как абстрактной знаковой системы с целью построения теоретической основы машинного перевода и создания конкретных алгоритмов перевода. В таком понимании математическая лингвистика составляла часть семиотики - общей теории знаковых систем. Задача аксиоматизации лингвистики была выдвинута одним из виднейших лингвистов московской школы П. С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914). Исследованию формальной теории грамматик, была посвящена диссертация О. С. Кулагиной, выполненная под руководством А. А. Ляпунова. Заметим, что в те же годы формальная теория грамматик развивалась в США в трудах Н. Хомского, ставших классическими для области искусственных языков, в частности языков программирования. Двадцатилетие (1956-1976) один из основателей направления математик В. А. Успенский в своих воспоминаниях назвал "серебряным веком" структурной, прикладной и математической лингвистики в СССР (видимо, по аналогии с "серебряным веком" русской поэзии). В 70-х годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г. Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RE RA S фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ. Практическое применение принципов смыслового анализа текстов потребовалось при создании систем машинного перевода с иероглифических языков (китайского, японского и др.). Вопросы создания таких систем были разработаны в диссертации В. М. Зелко в 80-х годах. Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов. Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты.
Так без всяких размышлений и я стала постоянным участником организованного Игорем маленького семинара по математике, который с осени 1957 года у нас в институте вел прекрасный математик Аркадий Онищик. В математике я была всегда не сильна, но вне зависимости от этого мне как-то даже не пришло в голову усомниться в том, резонно ли начинать серьезные занятия лингвистикой именно с математики. Как я уже упоминала, в университете я выбрала лингвистику, но не получила основательного лингвистического образования. Казалось бы, надо было восполнять именно эти пробелы. Однако же необходимость освоения каких-то основ математики не мне одной представлялась тогда делом первостепенным. Наш семинар проходил в той самой "комнате за залом", где, начиная с лета 1958 года, мы потом сидели вместе с Игорем в Секторе Реформатского. В нем участвовал покойный Ю. К. Лекомцев - востоковед и совершенно своеобразный теоретик; Т. Н. Молошная - лингвист, работавшая с О. С. Кулагиной и А. А. Ляпуновым над машинным переводом с английского; Е. В. Падучева, которая тогда занималась возможностями теоретико-информационного подхода к изучению языка, и я
1. Реклама по-английски и по-русски: трудная легкость языка
2. Изучение английского языка с использованием компьютерной программы "English Puzzle"
3. Программа для перевода текстов с транслита
4. Дивергенция языков и проблема корреляции между языком и расой
5. Разработка компьютерной программы на языке Паскаль для проведения простого теплофизического расчета
9. Электронные словари и их применимость для традиционного машинного перевода
10. Особенности перевода поэзии на английский язык
12. Машинный перевод
13. Способы перевода терминов с английского языка на русский (на материале экономических текстов)
14. Перевод английской устной речи на русский язык (на примере художественных фильмов)
15. Письменный перевод с английского языка на русский язык
16. Теория перевода с английского языка
17. Проблемы автоматизации перевода математической литературы с английского языка на русский
18. Перевод неологизмов в английских экономических текстах
19. Способы перевода просторечия, использованного в романе А. Силлитоу "Ключ от двери", на русский язык
21. Перевод кино- и видеопродукции с английского на русский
25. Перевод введения в книгу Й. Шумпетера History of economic analisys
26. Бернштейн И. Английские имена в русских переводах
27. Многозначность союзов и их перевод на русский язык
28. Общественно-политическая лексика и особенности ее перевода с французского языка на русский
29. Особенности перевода английских частиц в художественной литературе
30. Перевод английских текстов различной тематики
32. Переводческие трансформации. Опыт собственного перевода стихотворений английских авторов
33. Русско-английский перевод текстов
34. Трансформация фразеологизмов в англоязычной прессе и их перевод на русский язык
35. Особенности перевода лирики И.В. Гете на русский язык
36. Экономика Аргентины (перевод англоязычной статьи с приложениями)
37. Трудовое право: понятие и виды переводов
41. Образцы писем делового характера по английскому языку
42. Английский язык (11 класс)
43. Категория "противоположность" в английском языке
44. Куча топиков по английскому языку
45. Список мирового наследия (The World Heritage List, на английском языке)
46. Топики по английскому языку
47. Топики по Английскому языку
48. Билеты по английскому языку за 11 класс
49. Сохранение национальной окраски при переводе художественных произведений
50. Роль заимствований в английском языке
51. Билеты по английскому языку для 9 класса (2002г.)
52. Местоимения и слова-заместители в современном английском языке
53. Предмет исследования теоретической грамматики. Грамматический строй английского языка
57. Виды перевода
58. Перевод реалий
59. Русские заимствования в английском языке (Russian borrowings in English language)
60. Словарь по уборочным машинам и комбайнам
61. Темы по английскому языку (English topics)
62. Лингвистические основы обучения произношению английского языка в каракалпакской школе
63. Английский язык в Южной Африке
64. Перевод авторских неологизмов в трилогии Д.Р.Р. Толкиена "Властелин колец"
65. Формы обращения в английском языке
66. Иностранные заимствования в лексике английского языка
67. Книга Г.О. Винокура "О языке художественной литературы"
68. Топики по Английскому языку для англ.шк. (10 класс)
69. Сопоставительный анализ употребления перформативных глаголов в русском и английском языках
73. Имена собственные в оригинале и переводе
74. Сравнительное описание слоговых структур английского и каракалпакского языков
75. Английский язык в Южной Африке
76. Перевод авторских неологизмов в трилогии Д.Р.Р. Толкиена "Властелин колец"
77. Перевод и анализ стихотворения Эдгара По "Fairy Land"
78. Повесть Временных Лет в переводе Лихачева
79. Система научно-технического перевода (пример перевода программой PROMT Гигант)
80. Вычислительные машины и системы
81. Методичний посібник до курсового проекту з дисципліни "Цифрові обчислювальні машини"
82. История развития ЭВМ. Механические и электромеханические счетные машины
83. Принципы реализации машин БД
84. Аналитический обзор книги "Программирование на языке ассемблера..."
85. Машины, которые говорят и слушают
89. Научно-педагогическое обоснование урока английского языка в 8“б” классе Лингвистической гимназии №3
90. Лингвистические основы обучения произношению английского языка в каракалпакской школе
91. Разработка конструкции импульсной формовочной машины. Опока 1600х1200х500
92. Цифровые машины фирмы Indigo NV
93. Отчет по практике по курсу "Строительные машины"
94. Надежность машин: станки, промышленные роботы
95. Технология ремонта автомобилей и дорожных машин
96. Детали машин, червячный редуктор
98. Проект восстановления гидроцилиндров лесных машин полимерными материалами