litbaza книги онлайнДомашняяПутеводитель зоолога по Галактике. Что земные животные могут рассказать об инопланетянах – и о нас самих - Арик Кершенбаум

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 62 63 64 65 66 67 68 69 70 ... 90
Перейти на страницу:

Характерные признаки языка

В научно-фантастическом романе астронома Карла Сагана «Контакт» главная героиня, доктор Элли Эрроуэй, получает радиосигнал из космоса, который, по-видимому, содержит последовательность простых чисел. Но почему? Зачем кому-то посылать нам длинный ряд чисел? Она объясняет:

Мы принимаем сигнал маяка. Нас окликают, чтобы просто привлечь наше внимание. ‹…› Трудно себе представить, чтобы плазменное облако или взрывающаяся галактика ни с того ни с сего разродились чисто математической последовательностью. Простые числа всего лишь должны привлечь наше внимание[102].

Героине романа повезло: она получила «сигнал маяка». Сам Саган долго бился не только над вопросом, как ловить инопланетные сообщения, но и над тем, как посылать их. Решением, как он полагал, было использовать простые числа, поскольку ни один известный природный процесс не может воспроизвести последовательность простых чисел. Это бесспорный признак сознательно отправленного сигнала. Поэтому, когда мы наконец получим подобный инопланетный сигнал, мы, несомненно, сможем распознать в нем сигнал радиомаяка.

Но что, если мы получим сигнал, не предназначенный для инопланетных (то есть наших) ушей? Радио— и телевизионные передачи планеты Земля разлетаются в пространство со скоростью света, словно непрерывно расширяющийся пузырь. В то время как я пишу эти строки, потенциально обитаемая экзопланета TRAPPIST-1e, находящаяся всего в 39 световых годах от нас, принимает наши новости о безуспешной попытке США спасти заложников из американского посольства в Тегеране в 1980 г. Что из наших сигналов поймут обитатели системы TRAPPIST-1? Эти сигналы явно не последовательность простых чисел — догадаются ли вообще «трапписты», что перед ними целенаправленная коммуникация? И сможем ли мы сами распознать инопланетные телепередачи?

В действительности распознать сообщения от развитых технологических цивилизаций будет достаточно легко, даже если они не содержат ряда простых чисел. Существует множество характерных признаков наличия технологий — по закономерностям, не встречающимся в природе. Даже если инопланетяне используют самые продвинутые технологии, можно с уверенностью утверждать, что мы сумеем их опознать. Но как насчет языка, на котором будет передано сообщение? Есть ли у нас способ узнать, что это именно язык? Если мы «приземлимся» на чужой планете и услышим обращенный к нам лепет зеленого инопланетного создания, сможем ли мы определить, что оно использует речь, а не инопланетный аналог птичьего пения? Откуда мы вообще можем знать, что земные животные не разговаривают с нами на каком-то языке?

Мы ищем универсальный критерий языка — нечто вроде математического алгоритма, с помощью которого можно обработать сигнал и сделать вывод: «да, это язык» или «нет, это не язык». Нам необходимо разработать подобный алгоритм еще до того, как мы соберемся расшифровывать какой-либо сигнал. Но есть ли основания считать, что такой универсальный критерий существует? Мы уже исследовали некоторые весьма экзотические способы, с помощью которых могут общаться инопланетяне, вроде игры красок на коже, как у каракатиц. Как может алгоритм, разработанный на основе наших языков, помочь определить, что это инопланетный язык?

Самые распространенные подходы к выделению отличительных признаков языка основываются, конечно, на строении земных языков. Если язык состоит из слов и предложений, то с помощью некоторых методов теории информации (одного из разделов прикладной математики) можно сделать прогнозы насчет статистических свойств этих слов и предложений. Идея состоит в том, что язык должен быть достаточно сложным, чтобы выразить все необходимые понятия, но не настолько сложным, чтобы для построения и понимания предложений требовался неоправданно большой мозг (или его аналог). Существует определенный баланс между сложностью и простотой, и любой набор предложений, отвечающих этим условиям, вполне может претендовать на то, чтобы считаться осмысленным текстом.

Один из способов измерить соотношение простоты и сложности в сообщении — подсчитать частоту употребления самых распространенных слов. Хорошо известно, хотя и довольно любопытно, что самое распространенное слово в английском языке (определенный артикль the) встречается в два раза чаще, чем стоящий на втором месте по частотности предлог of (показатель родительного падежа), и в три раза чаще, чем стоящий на третьем месте сочинительный союз and «и». Более того, это соотношение достаточно хорошо сохраняется для 10 000 наиболее часто употребляемых слов английского языка — слово, стоящее на десятитысячном месте по частотности, встречается в 10 000 раз реже, чем артикль the. Что еще любопытнее, этот эффект наблюдается и в остальных человеческих языках! Во французском определенный артикль мужского рода le встречается в два раза чаще, чем предлог родительного падежа de, и втрое чаще, чем сочинительный союз et. Будьте уверены: это весьма специфическая закономерность.

Так вот, эта закономерность распределения частоты слов называется законом Ципфа, в честь американского лингвиста Джорджа Ципфа, который сформулировал его на основе своих исследований еще в 1930-е гг. Данное явление привлекает большое внимание ученых, работающих в SETI — проекте поиска внеземного разума[103]. Если закон Ципфа отражает действительно универсальное свойство языка, он должен быть хорошим критерием оценки любых сигналов, которые мы получим. К сожалению, до сих пор не совсем понятно, почему закон Ципфа работает для всех языков, а это значит, что мы пока еще не можем утверждать с уверенностью, распространяется ли он на все языки вообще, а не только на земные. Однако в утверждении о его универсальности есть некоторая логика.

По сути, закон Ципфа как раз и отражает баланс простоты и сложности. Возьмем сигнал, действительно случайно сгенерированный, скажем, из первых пяти букв алфавита — A, B, C, D, E, — которые могут с равной вероятностью располагаться в любом порядке. Неважно, какая последовательность букв уже принята — вероятность, что следующей буквой окажется А, равна 1:5, и такова же вероятность для любой другой буквы. Такой сигнал будет не просто случайным, но очень сложным. Он будет обладать максимальной вероятной сложностью, поскольку у вас нет ни малейшей возможности предсказать, какая буква появится следующей. В теории информации сложность и случайность практически тождественны. Это звучит парадоксально, ведь мы ожидаем, что осмысленное сообщение будет каким угодно, но не случайным. Однако теория информации и закон Ципфа ничего не говорят нам ни о том, какой смысл отправитель вкладывает в сообщение, ни даже о том, какой объем информации реально содержится в сообщении — а лишь определяют потенциальную информационную емкость сообщения. Случайно сгенерированный сигнал теоретически мог бы содержать максимальный объем информации, но если он действительно случаен, этот объем нулевой. Это все равно что взять большой текстовый файл и сжать его, используя алгоритм сжатия файлов. Огромный файл становится крошечным, но знаки в сжатом файле выглядят случайными — поскольку это самый эффективный способ хранения информации.

1 ... 62 63 64 65 66 67 68 69 70 ... 90
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?