Шрифт:
Интервал:
Закладка:
Если вам трудно в это поверить, рассмотрим противоположный пример — сигнал, где в 96 % случаев следующей буквой оказывается А и лишь по 1 % приходится на B, C, D и E. В любом случае я практически уверен, что следующей буквой окажется А. Сколько информации содержит такой сигнал? Немного — по сути, только А. Такие стереотипные сигналы, когда можно угадать, что последует дальше, просты, но содержат мало информации. Поэтому диапазон от сложности до простоты — в действительности диапазон от случайности до повторяемости.
Математический расчет показывает, что соотношение, отражающее закон Ципфа, лежит как раз посредине между 20 % вероятности для каждой буквы (случайность) и 96 % против 1 % соответственно (стереотипный сигнал). В случае подобной сбалансированности ожидается, что А будет встречаться вдвое чаще, чем В, и втрое чаще, чем С, и т. д. Для сигнала всего из пяти букв распределение будет примерно таким: 44 % А, 22 % В, 14 % С, 11 % D и 9 % Е. По-видимому, эти вероятности отражают объективно сбалансированный способ передачи сигнала — не слишком сложный и не слишком простой. Вот почему, как считается, закон Ципфа так широко распространен. Он обеспечивает уровень сложности, достаточный для передачи информации, но не избыточный.
Любопытная вещь происходит, когда мы проверяем на соответствие закону Ципфа сигналы животных. Они почти всегда смещены в сторону «простоты» — слишком стереотипны для языка. И это логично: птичье пение действительно более однообразно, чем поэзия Шекспира. Как бы красиво ни пели птицы, их песни никогда не станут языком — они слишком просты, слишком стереотипны, они не соответствуют закону Ципфа и не попадают в точку равновесия между простотой и сложностью. Однако некоторые животные способны на большее. Мой коллега Лоренс Дойл из Института SETI стал одним из первых, кто предложил использовать коммуникацию животных для проверки методов распознавания инопланетных сигналов. Он обнаружил, что общение дельфинов приближается к закону Ципфа настолько, насколько это возможно. В ходе собственных исследований я обнаружил это свойство и у сигналов косаток. Весьма интригующий факт.
Однако сей факт вовсе не означает, что у дельфинов или косаток есть речь, и это является главной проблемой с поисками критериев определения языка и, в частности, с применением закона Ципфа. «Ложных тревог» наверняка будет много. Например, баланс простоты и сложности, сформулированный в законе Ципфа, не только является признаком языка, но и, по-видимому, может применяться более широко. Возможно, другой вид сумел приспособить его для иных, не связанных с языком целей. Косатки, безусловно, передают друг другу сложную информацию, но этой информации не обязательно быть настоящей речью, чтобы соответствовать закону Ципфа. Более того, некоторые другие виды, включая певчих птиц, от которых не принято ожидать больших лингвистических успехов, тоже до некоторой степени следуют закону Ципфа. Я бы предположил, что баланс простоты и сложности по закону Ципфа может быть предпосылкой для того, чтобы коммуникативная система развилась в настоящий язык, но сам по себе он не может быть критерием инопланетного языка. Этот закон может действовать по многим другим причинам.
Серьезное ограничение применимости закона Ципфа состоит в том, что он касается только частотности слов, а язык — это нечто гораздо большее, чем просто частота употребления союза «и». Информация содержится не только в самих словах, но и в отношениях между ними. Как мы убедились, предложение «Пух и Пятачок пошли охотиться и чуть не поймали Буку» — лингвистически правильное, а «чуть пошли поймали и Буку не Пятачок и Пух охотиться» — бессмыслица, хотя оба они подчиняются закону Ципфа. Возможно, нам предстоит открыть аналог закона Ципфа, применимый к грамматической сложности, но пока этого не произошло. На беду, мои собственные изыскания показывают, что даже грамматика человеческих языков сложнее, чем предсказывает Ципф, поэтому наш поиск универсальных признаков языка продолжается. И тем не менее закон Ципфа как минимум дает нам первый фильтр — он позволяет отбросить сигналы, которые слишком просты или слишком сложны, чтобы быть речью.
Все наши поиски критериев определения языка пока что сосредоточены на последовательностях слов или символов. Конечно, так устроен наш собственный язык, и это вовсе не будет предвзятостью, если мы скажем, что у нас просто нет других типов настоящего языка для испытания разработанных нами алгоритмов. Нет смысла изобретать тест на признаки визуального языка каракатиц, потому что нам неизвестно, как может выглядеть настоящий визуальный язык. Однако в этой области ведутся активные исследования, и вполне разумно предположить, что теория информации в той или иной форме применима к языку картинок, как и к языку предложений. Изображения, в конце концов, можно сжать в случайные последовательности, как и текстовые файлы, а это значит, что их сложность можно измерить количественно так же, как сложность предложений. Это и есть, по моему мнению, самые многообещающие направления для исследований в рамках проекта SETI, даже если мы так и не встретимся с живыми инопланетянами.
* * *
Этот раздел начался с утверждения, что мы не знаем, что такое язык, и ответа мы так и не нашли. Но это нормально. Наши попытки понять, какой может быть инопланетная жизнь, в той же мере поиск правильных вопросов, как и правильных ответов. Наши будущие соседи и, как хотелось бы надеяться, собеседники непременно будут обладать каким-то языком, и было бы самонадеянно утверждать, что мы сможем заранее узнать каким. Но было бы безответственно отмахиваться от вопроса и просто заявлять: «Мы ничего не знаем».
На самом деле в некоторых фундаментальных свойствах инопланетного языка можно не сомневаться, и неважно, насколько он отличается от нашего. У языка есть две ключевые особенности, которые являются универсальными: это способ передачи сложных понятий и появление в ходе естественного отбора. По рассмотрении всех возможных путей, которыми можно прийти к языку, становится очевидно, что ни одна коммуникативная система не обладает монополией на соответствие этим критериям. И в то же время многие коммуникативные системы не отвечают какому-нибудь одному из этих двух требований. Либо они не обладают достаточной выразительностью, чтобы считаться «языком», либо не имеется убедительных доказательств их эволюционного развития — то есть невозможно представить, как язык мог развиться постепенно, обеспечивая на каждом этапе небольшое, но явное преимущество. Когда нам понадобится распознавать инопланетные языки, а затем и переводить с них, нам будет полезнее обращаться к этим фундаментальным особенностям, вместо того чтобы искать прямые параллели между нашим и их языком. При переводе с неизвестного человеческого языка мы можем быть уверены, что он состоит из слов типа существительных и глаголов, но в случае с инопланетным языком нам придется ставить иные вопросы еще до того, как мы начнем переводить. Что именно несет информацию? Какой цели служит язык? Каким образом происходило совместное эволюционное развитие языка инопланетян и их социального интеллекта?
В связи с этим напрашивается весьма интересный вывод: оказывается, многие факторы, которые, как мы предположили, являются фундаментальными для языка (наличие слов и предложений, грамматики), не столь существенны, в то время как вещи, которые мы никогда не относили к области лингвистики (например, общественная жизнь), по-видимому, играют столь же важную роль в инопланетных мирах, как и в нашем. Язык — настолько неотъемлемый признак человека, что мы ожидаем и у других разумных, наделенных сознанием существ встретить это яркое свидетельство их общности с нами. И в самом деле, язык является глубинной отличительной чертой как человечества, так и его инопланетных аналогов. Но эта фундаментальная сущность языка, общая для всех цивилизаций во Вселенной, не сводится к способности сказать «Мы желаем вам счастья». Хотя я все-таки надеюсь, что мы сумеем верно перевести эти слова при Первом контакте.