Шрифт:
Интервал:
Закладка:
Именно JALPG стала учредителем ALPAC. В состав комитета вошли представители Bell Labs, RAND Corporation, Корнеллского и Чикагского университетов, Гарварда и Технологического института Карнеги (который в 1967 г., после слияния с Институтом индустриальных исследований Меллона, стал уже упоминаемым ранее Университетом Карнеги — Меллона). Среди семи членов ALPAC были исследователи в области ИИ, в том числе бывшие участники проектов по машинному переводу (но разочаровавшиеся в данном направлении и пессимистично настроенные), лингвисты и один психолог. Впрочем, комитет заслушал свидетельства активных исследователей в области машинного перевода, таких как Пол Гарвин, Джулс Мерсел, Гилберт Кинг и Уинфред Леманн.
Комитет с самого начала настаивал на том, что целью государственного финансирования исследований в области машинного перевода может быть лишь прикладной результат — снижение затрат, существенный рост производительности или удовлетворение оперативных потребностей. Исходя из этих прикладных целей, ALPAC изучил общее состояние дел в области перевода. При этом доклад был сосредоточен исключительно на правительственных и военных потребностях США в анализе русскоязычных документов[2043].
Для понимания контекста ситуации надо отметить важный момент: после запуска советского спутника в 1957 г. и полёта в космос Юрия Гагарина в 1961 г. США предприняли меры, чтобы не допускать отставания от СССР в научно-техническом прогрессе. Наряду c принятием космической программы с планом высадки на Луну и с расширением мест научно-технических специальностей в вузах, было принято решение о резком увеличении перевода советской научно-технической литературы на английский.
В результате выделения средств, найма в качестве переводчиков учёных-профессионалов и быстрого обучения их русскому языку начался, по мнению Майкла Гордина, «самый грандиозный проект научного перевода в мировой истории». Уже в начале 1960-х более 80 советских научных журналов переводилось от корки до корки — каждая страница каждого выпуска, а только одна частная компания Consultants Bureau переводила 34 000 страниц русских научных текстов в год. Понятно, что качество такого перевода было далеко не идеальным, но для общего понимания оно было достаточным[2044], [2045].
Исходя из таких масштабов переводов с русского языка, становится понятной важность задачи автоматизации перевода.
Первое, на что следует обратить внимание: отчёт ALPAC озаглавлен «Языки и машины: компьютеры в переводе и лингвистике». Таким образом, доклад не ограничивался одним только машинным переводом и был посвящён более широкой области — компьютерной лингвистике в целом. На деле, конечно, большая часть финансируемых государством исследований в области обработки естественного языка в то время была сосредоточена на полномасштабном машинном переводе.
Первая половина отчёта посвящена исследованию потребностей в переводах американских учёных и государственных служащих, а также вопросу количества переводчиков с русского языка. ALPAC начал отчёт с предложения, что поскольку английский является основным языком научной литературы (76% всех статей в 1965 г.), то, возможно, самым простым и экономически выгодным решением будет обучить всех нуждающихся в чтении русскоязычных материалов чтению статей на языке оригинала. Авторы отчёта исходили из предположения о том, что для овладения этим навыком нужно потратить не более 200 часов времени (видимо, имея в виду вышеуказанный опыт быстрого обучения учёных русскому языку для перевода).
Затем комитет рассмотрел вопрос о количестве переводчиков (штатных и внештатных), выполняющих переводы по заказам государственных учреждений. ALPAC не смог определить точное количество штатных переводчиков, но установил, что средняя зарплата переводчиков была заметно ниже, чем у работавших в тех же учреждениях учёных, притом что текучка кадров среди переводчиков весьма низка. На основании этих и некоторых других фактов комитет пришёл к выводу, что предложение в области перевода превышает спрос, резюмируя итоги анализа ситуации с переводами следующим образом: «В области перевода отсутствует какая-либо чрезвычайная ситуация. Задача не в том, чтобы удовлетворить какую-либо несуществующую потребность посредством несуществующего машинного перевода. Однако существует несколько важных проблем с переводами, а именно их качество, скорость и стоимость».
Для оценки качества ALPAC организовал эксперимент, в ходе которого оценивались переводы, выполненные как людьми, так и машинами. Авторы отчёта проанализировали работу четырёх систем машинного перевода. Помимо системы Джорджтаунского университета и системы, разработанной Гилбертом Кингом во время его работы в IBM и использовавшейся в то время в Отделе иностранных технологий (Foreign Technology Division, FTD), также изучались экспериментальные прототипы систем от компаний Bunker-Ramo и Computer Concepts. Компания Computer Concepts была основана выходцем из Джорджтаунского проекта Питером Тома. Системой, представленной Computer Concepts на тестирование, была, по всей видимости, AUTOTRAN, основанная во многом на версии джорджтаунской системы под названием SERNA и являвшаяся предшественницей популярной в будущем системы SYSTRAN.
В отношении скорости перевода ALPAC видел немалый потенциал для улучшения: учёные жаловались на задержки. Машинный перевод текста за счёт затрат на ручное редактирование полученных переводов на деле был медленнее, чем перевод, выполняемый людьми. Исходя из того, что плата переводчикам-людям варьировала в пределах от 9 до 66 долларов за 1000 слов, а также из факта, что читатель неотредактированного машинного перевода затрачивал на чтение статьи в среднем в два раза больше времени, чем на чтение качественного перевода, выполненного человеком, авторы ALPAC подсчитали, что если документ должен быть прочитан более чем 20 людьми, то традиционный человеческий перевод оказывается дешевле машинного.
Вторая половина отчёта начинается тем, что авторы ALPAC определили машинный перевод как алгоритмическую процедуру, получающую на вход машиночитаемый текст и производящую на выходе полезный текст без привлечения людей-переводчиков или редактуры. Основываясь на этом определении и изучении опыта использования систем машинного перевода, комиссия пришла к выводу, что машинного перевода произвольного научного текста в настоящее время не существует и не предвидится в ближайшей перспективе. В качестве подтверждения своего вывода авторы отчёта привели тот факт, что «после восьми лет работы, в 1962 г., в проекте машинного перевода Джорджтаунского университета для получения полезного результата вынуждены прибегать к постредактированию. При этом перевод с последующим редактированием выполняется дольше и обходится дороже, чем обычный перевод человека». К постредактированию машинного перевода прибегали и пользователи системы в FTD, что, по мнению ALPAC, также было свидетельством фиаско.
Вывод экспертов ALPAC в отношении качества машинного перевода был следующим: «Неотредактированный машинный перевод научного текста по большей части можно разобрать, но иногда он вводит в заблуждение, а иногда неверен… это делает чтение медленным и мучительным». По мнению комитета, исследования в области машинного перевода следовало продолжать во имя