litbaza книги онлайнРазная литератураОхота на электроовец. Большая книга искусственного интеллекта - Сергей Сергеевич Марков

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 219 220 221 222 223 224 225 226 227 ... 482
Перейти на страницу:
науки, но не рассчитывать на ощутимое улучшение в практике перевода: «Возможно, наше отношение могло быть другим, если бы существовала некая насущная потребность в машинном переводе, но мы её не обнаружили». По сути, формулировки экспертов ALPAC были убийственными: если бы в мире где-то и существовало военное ведомство, финансирующее что-либо во имя науки, то его, вне всякого сомнения, добавили бы в список семи чудес света под номером ноль.

С несколько большим энтузиазмом авторы отчёта смотрели на системы, призванные облегчить работу людей-переводчиков: базы данных терминов, глоссарии и так далее. Это технологическое направление в наши дни называют обычно автоматизированным переводом (Computer-Aided Translation, CAT). Лейтмотивом выводов ALPAC была мысль о том, что подобные инструменты, какими бы примитивными они ни были, с экономической точки зрения гораздо эффективнее, чем любые системы машинного перевода.

Итоговые рекомендации ALPAC заключались в том, что государству следует поддерживать исследования в определённых областях:

• практические методы оценки переводов;

• средства для ускорения процесса перевода, выполняемого людьми;

• оценка качества и стоимости различных источников переводов;

• изучение использования переводов (для защиты от выполнения невостребованных переводов);

• изучение задержек в общем процессе перевода и способов их устранения (в отношении как журналов, так и отдельных статей);

• оценка относительной скорости и стоимости различных видов машинного перевода;

• адаптация существующих процессов механизированного редактирования и производственных процессов для задач перевода;

• обобщённый процесс перевода;

• подготовка адекватных справочных работ для переводчика, включая адаптацию глоссариев, которые в настоящее время существуют в основном для автоматического поиска в словарях при машинном переводе.

Интересно, что категорические выводы экспертов ALPAC не слишком согласуются с данными опроса переводчиков, приведёнными в одном из приложений к отчёту. В приложении 14 сообщается об исследовании, в рамках которого 22 переводчикам было предложено сравнивать сложность перевода двух фрагментов из книги по кибернетике со сложностью постредактирования машинного перевода тех же фрагментов. Голоса переводчиков разделились поровну: восемь из них посчитали постредактирование более сложной задачей, шесть сочли обе задачи примерно одинаковыми по сложности, а восемь заявили, что постредактирование было проще. Это не единственная претензия, которую можно предъявить к выводам комиссии. Например, указанная в отчёте оценка суммы государственных вложений в системы машинного перевода, по всей видимости, завышена примерно в полтора раза (до 20 млн долларов вместо 12–13). Впрочем, с формальной точки зрения выводы отчёта не выглядели катастрофичными. Более того, авторы признавали, например, тот факт, что исследования в области машинного перевода помогли совершить серьёзный прорыв в области лингвистики. Однако в вопросе о том, можно ли в обозримом будущем рассчитывать на прикладные результаты, отчёт давал вполне однозначный ответ — нет. Эта мысль красной нитью проходит через весь текст документа. По всей видимости, именно этот вывод повлиял на дальнейшие бюджетные решения. Отчёт ALPAC сыграл примерно ту же роль для машинного перевода, что и приснопамятное письмо Бэббиджа Веллингтону для проекта разностной машины: разочарованные невозможностью получить быстрый хозяйственный эффект, лица, принимающие решения, предпочли резко сократить финансирование. За 130 лет масштаб инновационных проектов вырос многократно, однако с финансовой точки зрения они стали только более уязвимыми, поскольку для своего развития требовали куда более значительной концентрации финансовых и материальных ресурсов. Если Бэббидж мог взять на себя половину затрат на свой проект, то в годы баснословной дороговизны машинного времени ЭВМ подобную схему финансирования было трудно представить.

Впрочем, как отказ правительства Великобритании финансировать проект Бэббиджа, так и резкое сокращение финансирования проектов в области машинного перевода по итогам рассмотрения отчёта ALPAC не привели к полной остановке работ в соответствующих областях. Считается, что результатом работы ALPAC стала утрата интереса к области машинного перевода в США на десять лет (а если говорить об отказе в правительственном финансировании проектов в этой области, то и на более длительный период), а также формирование стойкого убеждения в том, что идея машинного перевода обернулась полным провалом (некоторые динозавры считают так и по сей день). Но, хотя влияние отчёта на отрасль в целом и не подвергается сомнению, в некоторых отношениях оно, возможно, преувеличено. Исследования машинного перевода в США не были прекращены полностью и бесповоротно, некоторые исследовательские группы продолжали работу над проектами в этой области — например группа под руководством Гарри Джоссельсона в Университете Уэйна (Wayne State University, WSU) или группа под руководством Уинфреда Леманна и Рольфа Стаховица в Университете Техаса. При этом многие проекты в области машинного перевода лишились государственного финансирования ещё до выхода отчёта. Например, в 1962 г. было прекращено финансирование соответствующих программ в Университете штата Вашингтон и Мичиганском университете. Проект Джорджтаунского университета, чья система была подвергнута резкой критике со стороны ALPAC, не получал финансирования после 1963 г.[2046] И наконец, некоторые проекты развивались за счёт средств частного сектора, как, например, уже упомянутая SYSTRAN Питера Тома. Появление этой системы, на многие годы ставшей «золотым стандартом», пришлось на самый разгар «зимы машинного перевода».

Конечно, критика со стороны ALPAC была во многом справедливой. Системы машинного перевода, созданные на момент выхода отчёта, были весьма примитивными по сегодняшним меркам, а качество выполняемого ими перевода даже для текстов сравнительно узкой тематики оставляло желать лучшего. Тщательно подготовленные демонстрации, производившиеся на заре машинного перевода, создавали у зрителей обманчивое ощущение того, что задача машинного перевода если уже не решена, то будет решена в ближайшие годы. Однако эти иллюзии не выдержали столкновения с суровой действительностью, что могло вызвать обиду и разочарование, в том числе и у лиц, причастных к распределению государственных фондов.

6.3.2.5 Подходы к машинному переводу и его дальнейшее развитие

Подход, положенный в основу большинства систем машинного перевода, созданных до 1960-х гг., иногда называют прямым переводом. Системы разрабатывались обычно для конкретной пары языков. Синтаксис и семантика языка анализировались в таких системах лишь до той степени, в которой это было необходимо для разрешения неоднозначностей, выбора правильных вариантов перевода слов и определения порядка слов в результирующих предложениях.

Типичным примером была система Джорджтаунского университета, которая в итоге оказалась одной из наиболее успешных систем, основанных на прямом переводе. Исследовательская группа из Джорджтауна использовала технику, которую Гарвин позже назвал методом грубой силы [brute force]: программа разрабатывалась на основе некоторого корпуса текстов, затем проверялась на другом корпусе, исправлялась и улучшалась, затем тестировалась на ещё большем корпусе, улучшалась вновь и так далее. Результатом стала монолитная программа с запутанной структурой, без чёткого разделения частей, отвечающих за анализ исходного и синтез результирующего текста. Синтаксический анализ был реализован лишь в зачаточной форме, отсутствовали

1 ... 219 220 221 222 223 224 225 226 227 ... 482
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?