Шрифт:
Интервал:
Закладка:
До момента когда Браун и Мерсер решили заняться переводом, в этой области доминировали программисты, которые на самом деле владели каким-либо иностранным языком. Применяемый ими подход состоял в том, чтобы понять суть языка, разобраться в грамматике и синтаксисе и научить компьютер, что la fllle значит «девочка», a les filles — это множественное число, почти как научить школьника. Но метод Брауна и Мерсера был другим. Они не знали французского, и они не были готовы пробираться через грамматику или синтаксис. Вместо этого они раздобыли записи канадского парламента, где были тысячи страниц парных отрывков на английском и французском. Они скормили материал компьютеру IBM и поставили задачу найти соответствия.
В отличие от результатов Брауна и Мерсера, достигнутых позже в Renaissance, их эксперимент в IBM был опубликован21. Процесс начался с чистки данных: так же как финансовые архивы по ценам должны были проверяться на «плохие связки», то есть места, где цена заявлялась на отметке 16 долларов вместо 61, так и запись из канадского парламента могла содержать опечатки, способные запутать переводческую программу. Следующим шагом компьютер начал сканировать данные на повторяемость шаблонов. Все, что знал компьютер вначале, было то, что любое английское слово могло быть переведено любым из 58 тысяч французских слов в данном образце, но как только компьютер проходил через парные отрывки, он обнаруживал, что большинство английских слов встречались лишь в некоторых из них. Тут же 99 % неопределенности исчезало. Далее компьютер приступал к серии более изощренных сравнений. Например, он предполагал, что английское слово скорее всего будет соответствовать французскому, если они встречаются в предложении на одном о том же месте. К этому моменту начали формироваться явные пары слов, такие как «lait — молоко» и «pourquoi — почему». Но другие корреляции были менее заметны. Чтобы их рассмотреть, нужно было проходить по данным снова и снова, каждый раз немного изменяя алгоритмы. Только так можно было различить такие едва заметные пары, как «marque d’un asterisque — отмеченный звездой» и неуловимые «qui s’est fait bousculer — потрепанный в бою», рассказывали Браун и Мерсер.
У дешифровщиков в Институте оборонного анализа этот метод удивления бы не вызвал22. Действительно, Браун и Мерсер использовали инструмент, называемый «алгоритм максимизации ожиданий» и цитировали его создателя, Леонарда Баума — того самого Баума, который работал на институт и позже на Саймонса23. И хотя идея «статистического машинного перевода» казалась вполне естественной дешифровщикам, создателями традиционных переводческих программ она была встречена в штыки. Один обозреватель язвил, что «грубая сила компьютеров не есть наука», а когда выпуск газеты был представлен на собрании экспертов перевода, один из них вспоминал: «Мы были ошарашены… Люди качали головами и отпускали смешки недоверия или даже враждебности». — «Где же лингвистическая интуиция?» — интересовалась аудитория. Ответом было: «В том то и дело. Ее нет». Фред Желинек, один из менеджеров IBM, который следил за Брауном и Мерсером, подсыпал соли на рану. «С каждым уволенным лингвистом моя система начинает работать лучше», — говорил он скептикам24.
К тому времени когда Браун и Мерсер ушли в Renaissance, скептики начали капитулировать. Разобравшись с канадскими парламентскими отчетами, программа команды IBM могла переводить и другие материалы. Если вы давали ей статью из французской газеты, программа пробегала по своей парламентской базе, находя соответствия с расшифрованным материалом. Результаты на голову превосходили конкурирующие переводческие системы, и через несколько лет появление статистического машинного перевода праздновалось среди специалистов по компьютерным разработкам как нечто сродни интеллектуальной революции25. Канадская политическая риторика оказалась более полезной, чем могли предположить. Браун и Мерсер преподали миру очередной урок на тему искусственного интеллекта.
Урок касался разницы между человеческими существами и компьютерами. Ранние переводческие программы пытались научить компьютер словарному запасу и грамматике, потому что именно так учатся люди. Но компьютерам больше соответствует другой подход: они могут научиться переводить с английского на французский, не отвлекаясь на правила каждого из языков. Компьютерам не нужно понимать спряжение глаголов или окончания прилагательных прежде, чем они примутся за гору политических речей; они предпочитают сначала получить тексты, затем применить к ним свой код, алгоритм за алгоритмом. Также компьютерам ничего не стоит держать в памяти миллионы предложений, они могут учить язык кусками, не мучаясь с грамматическими правилами, используемыми студентами-людьми для запоминания. Например, компьютер может запомнить английский перевод для фраз la fllle est intelligente и les filles sont intelligentes и дюжину подобных, но ему необязательно понимать, что filles — это множественное число filles, a est и sont — разные формы глагола etre и т. д.26 В противовес хмыканью критиков в адрес команды IBM грубая сила компьютерной памяти могла, по сути, стать заменой человеческому представлению об уме и науке. Кроме того, компьютеры склонны работать лучше, когда они не пытаются достичь результатов человеческим путем.
Как это могло помочь работе Medallion? Вероятно, никак. И опять же причины потрясающей успешности фонда остаются секретом. Очевидно лишь, что подход Брауна и Мерсера к программированию фундаментально отличался от того, что по этому поводу думали разработчики программ других хедж-фондов. Например, у Тюдора Сушил Вадвани натаскивал компьютер подходить к рынкам, как это делали бы трейдеры-люди. Браун и Мерсер, напротив, сами тренировались подходить к проблеме, как это делали бы компьютеры. В компании D. Е. Shaw часто начинали с теорий о рынке, которые потом тестировались на данных. Браун и Мерсер, наоборот, сначала снабжали компьютер данными и ждали от него ответов. Подход D. Е. Shaw напоминает работу программистов, которые учили компьютеры французской грамматике. Подход Брауна и Мерсера напоминает работу дешифровщиков, которые не обязаны начинать с учебника грамматики. Загруженные бессвязными на первый взгляд данными и лишенные каких бы то ни было подсказок, они упорно просеивали материал в поисках повторений, используя мощь компьютеров в охоте на призраков, невидимых человеческим глазом.
У многочисленных конкурентов Renaissance есть свои причины отказаться от погони за призраками. Компьютер может отобрать фальшивые призраки, существующие только по воле случая и соответственно не имеющие никакой ценности для прогноза. Эрик Вепсик, ведущий авторитет по статистике в D. Е. Shaw, приводит пример из Суперкубка: