Шрифт:
Интервал:
Закладка:
В будущем мы будем меньше полагаться на механические вычисления и больше – на взаимодействие и обучение. Система достаточно умна, чтобы понимать, что небольшое количество дополнительной информации может позволить ей отбросить один из ответов или повысить уверенность в одном из тех ответов, которые она уже предлагает. Когда Watson в одном из своих нынешних приложений сталкивается с трудным вопросом, он выдает набор возможных ответов – но также может и задавать уточняющие вопросы. Системы вопросов и ответов по большей части запрограммированы на работу с вопросами определенных типов – получить от них ответ можно только в том случае, когда им задают вопросы определенного рода, сформулированные определенным образом. Watson работает с произвольными вопросами по общей эрудиции, то есть о чем угодно. Используя технологии обработки естественного языка, он разбирает введенные в него слова, чтобы понять, о чем на самом деле задан вопрос, даже если он был задан в необычной форме.
Компания IBM даже опубликовала очень полезные «Вопросы и ответы» об алгоритме Watson и своем проекте DeepQA, основной технологии, которую Watson использует для выработки гипотез. Все это больше всего напоминает компьютер из «Звездного пути». Эту вымышленную компьютерную систему можно считать интерактивным диалоговым агентом, способным отвечать на вопросы и выдавать точную информацию по любой теме.
Трудности перевода
В школе мне тяжело давались иностранные языки. Я все еще помню, как прочитал в «Автостопом по Галактике» о вавилонской рыбке – существе, похожем на маленькую желтую пиявку, которое нужно было засунуть в ухо. Там рыбка питалась мозговыми волнами и моментально переводила своему носителю все, что говорилось вокруг него на любом языке. Вот это была бы полезная штука! Как часто бывает, вчерашняя фантастика уже стала сегодняшней научной реальностью. Недавно компания Google объявила о создании наушников Pixel Buds, которые делают именно то, о чем писал Дуглас Адамс.
Поскольку входящая информация представляет собой правильно построенное предложение, можно подумать, что работа по языковому анализу уже выполнена и остается только перевести отдельные слова. Но простая замена слов одного языка на слова другого часто приводит к возникновению поразительной мешанины. Возьмем, например, следующую цитату из «Госпожи Бовари»: La parole humaine est comme un chaudron fêlé où nous battons des mélodies à faire danser les ours, quand on voudrait attendrir les étoiles. Если я возьму свой франко-английский словарь и переведу последовательно каждое слово (при этом, правда, приходится кое-что выбирать, потому что для каждого слова словарь предлагает несколько возможных вариантов перевода), я получу вот что: The speech human is like a cauldron cracked where we fight of the melodies to make to dance the bears, when one would like to tenderise the stars [ «Речь человеческая похожа на чан треснутый, где мы бьем мелодий, чтобы заставить танцевать медведей, когда мы хотели бы размягчить звезды»][107]. Это, как мне кажется, не совсем то, что хотел сказать Флобер. Тут важно чувствовать, как функционирует язык. Увидев, что слово battons стоит близко к слову mélodies, можно попробовать изменить перевод bat-tons – сказать не fight [ «бьем»], а beat [ «отбиваем»] и, может быть, даже добавить the rhythm [ «ритм»]. Но и после этого у нас остается нерешенным вопрос о том, что значит tenderise [ «размягчить»] звезды.
Качественный переводческий алгоритм должен хорошо чувствовать, какие слова с большой вероятностью могут появляться вместе. Я помню, как замечательно мы развлекались с моим лучшим университетским другом, который учил персидский язык. Когда я заглядывал в его персидско-английский словарь, казалось, что у каждого слова есть по меньшей мере три совершенно разных значения и одно из них связано с сексом. Мы провели массу времени, придумывая самые сумасшедшие переводы одного и того же предложения по-персидски.
Современные переводческие алгоритмы опираются на основополагающую математическую форму языка. Оказывается, слова языка можно представить в виде точек в многомерном геометрическом пространстве, а затем соединить прямыми слова, между которыми существуют структурные связи. Например, тот факт, что слово «мужчина» соотносится со словом «король» так же, как слово «женщина» со словом «королева», означает в математическом выражении, что прямые, проведенные между словами каждой из этих пар, оказываются параллельными и однонаправленными. В итоге получается фигура, похожая на многомерный кристалл. Интересно отметить, что формы кристаллов французского и английского языков очень похожи, так что остается только сообразить, как сопоставить их друг с другом.
Я ввел ту же строчку из «Госпожи Бовари» Флобера в Google Translate, чтобы посмотреть, насколько этой программе удастся уловить ее смысл. Получилось вполне правдоподобно: The human word is like a cracked cauldron where we beat melodies to make the bears dance, when we want to soften the stars [ «Человеческое слово похоже на потрескавшийся чан, где мы отбиваем мелодии, чтобы заставить танцевать медведей, когда мы хотим смягчить звезды»]. Слово soften [ «смягчить»] явно уместнее, чем tenderise [ «размягчить»], но все равно кажется не вполне точным. Обратившись к переводу романа, вышедшему в издательстве Оксфордского университета (и выполненному по старинке человеком – в данном случае Маргарет Молдон), я нашел в нем следующее: Human speech is like a cracked kettle on which we tap crude rhythms for bears to dance to, while we long to make music that will melt the stars [ «Человеческая речь похожа на потрескавшийся котел, на котором мы отбиваем грубые ритмы медвежьих плясок, когда нам хотелось бы растрогать своей музыкой звезды»].
Становится понятно, насколько важно не только выбрать правильное слово, но и уловить чувство, заложенное в предложении. Алгоритмические переводчики все еще отбивают грубые ритмы медвежьих плясок, а человек способен переводить прозу, которая может растрогать звезды. В большинстве случаев грубых ритмов бывает вполне достаточно при условии, что перевод верно передает смысл, если не поэзию, фразы. Об успешности системы Google Translate свидетельствует тот факт, что она поддерживает сейчас 103 языка и переводит более 140 миллиардов слов в день.
Скоро ли люди, занимающиеся письменным и устным переводом, останутся без работы или по меньшей мере будут вынуждены заниматься не созданием собственных текстов, а только исправлением ошибок компьютерного перевода? На самом деле, мне кажется, что такие алгоритмы никогда не сравнятся с уровнем человеческого перевода. Во всяком случае, это произойдет не раньше, чем искусственный интеллект разрешит проблему сознания. Перевод не сводится к механическому переносу с одного языка на другой. Речь идет о переносе из одного разума в другой, и пока у машины нет духа, она не сможет полностью овладеть всеми тонкостями человеческого общения.
Возвращаясь к двум переводам отрывка из «Госпожи Бовари», я должен сказать, что предложенное алгоритмом слово cauldron [ «чан»] мне нравится больше, чем kettle [ «котел»]. А выражение to make the bears dance [ «чтобы заставить танцевать медведей»] звучит чуть более угрожающе, чем соответствующее место в человеческом переводе. Может быть, лучшие переводы в конце концов будут создаваться в сотрудничестве человека с машиной.