Шрифт:
Интервал:
Закладка:
Та дюжина или около того разных глобинов, которые имеются у каждого из нас, происходят от древнего гена глобина, который у нашего далекого предка, жившего около полумиллиарда лет назад, дуплицировался, после чего обе копии остались в геноме. Так у этого гена стало две копии в двух разных частях генома у всех потомков того животного. Одной копии суждено было положить начало альфа-кластеру (в том участке, который в итоге стал 11-й хромосомой нашего генома), другой — бета-кластеру (в 16-й хромосоме) . Шло время, происходили дальнейшие дупликации (а также, несомненно, и некоторые делеции). Около четырехсот миллионов лет назад предковый альфа-ген вновь дуплицировался, но на этот раз две полученные копии остались по соседству друг с другом, в одном кластере на той же хромосоме. Одному из них суждено было стать геном дзета-глобина, который используется эмбрионами, а другие стали генами альфа-глобинов, которые используются взрослыми людьми (другие ветви положили начало нефункциональным псевдогенам, упоминавшимся выше). Похожая история происходила и в бета-ветви этого семейства, только дупликации случались в другие моменты геологической истории.
Но вот еще один факт, столь же интересный. Учитывая, что расхождение между альфа-кластером и бета-кластером произошло пятьсот миллионов лет назад, разумеется, не только наши человеческие геномы должны демонстрировать это расхождение — то есть хранить альфа-гены в иной части генома, чем бета-гены. Мы должны наблюдать то же внутригеномное расхождение, если мы исследуем геномы любых других млекопитающих, птиц, рептилий, амфибий и костных рыб, потому что наш общий предок с ними всеми жил меньше, чем пятьсот миллионов лет назад. Где бы это предположение ни проверяли, оно подтверждалось. Позвоночное, у которого мы имеем наибольшие основания надеяться не обнаружить следов такого же как у нас древнего расхождения альфа- и бета-генов, должно быть бесчелюстным, таким как минога, потому что это наши самые дальние родственники среди доживших до наших дней позвоночных — единственные из современных позвоночных, чей общий предок с остальными позвоночными мог жить еще до расхождения альфа- и бета-генов. И действительно, эти бесчелюстные — единственные известные позвоночные, у которых разделение на альфа-и бета-гены отсутствует.
Дупликация генов в пределах генома играет сходную историческую роль с дупликацией видов (видообразованием) в филогенезе. Она ответственна за разнообразие генов, так же как видообразование ответственно за филетическое разнообразие. Все великолепное разнообразие жизни возникло, начавшись с одного всеобщего предка, посредством ряда ответвлений новых видов, которые в итоге положили начало большим ветвям царств живой природы и сотням миллионов других видов, украсивших собой Землю. Похожий ряд ветвлений, но на сей раз в пределах геномов (дупликаций генов), породил обширную и разнообразную популяцию кластеров генов, составляющих современный геном.
История глобинов — лишь одна из многих. Дупликации и делеции генов происходили время от времени во всех геномах. Именно такими и другими аналогичными путями размеры геномов и могут увеличиваться в ходе эволюции. Но припомните разницу между суммарной емкостью всего генома и емкостью той его части, которая реально используется. Вспомните, что используются не все гены глобинов. Некоторые из них, такие как тета-ген в альфа-кластере генов глобинов, представляют собой псевдогены, узнаваемо родственные функциональным генам в тех же геномах, но на деле никогда не переводимые на действующий язык белков. То же, что относится к глобинам, относится и к большинству других генов. По геномам разбросано множество нефункциональных псевдогенов — ошибочных дубликатов функциональных генов, которые ничего не делают, в то время как их функциональные родственники (здесь даже незачем осторожничать, ставя это слово в кавычки) продолжают делать свое дело в другой части того же генома. А есть и гораздо большее количество ДНК, которая не заслуживает даже названия псевдогенов.
Она тоже произошла путем дупликаций, но это были не дупликации функциональных генов. Она состоит из многочисленных копий разного мусора, “тандемных дупликаций” и прочей бессмыслицы, которая может быть полезна для судебно-медицинских экспертов, но, судя по всему, не используется в самом организме. И опять же креационисты могли бы хорошенько поразмыслить над тем, зачем Создателю понадобилось засорять геномы нетранслируемыми псевдогенами и тандемными дупликациями мусорной ДНК.
Можно ли измерить информационную емкость той части генома, которая реально используется? Ее можно, по крайней мере, оценить. В случае человеческого генома она составляет около 2 % — гораздо меньше, чем та часть своего жесткого диска, которую я использовал с тех пор, как купил его. Соответствующий показатель для генома гребенчатого тритона предположительно даже меньше, но мне неизвестно, измеряли ли его. В любом случае мы не должны выносить отсюда шовинистическую идею, что человеческий геном должен почему-либо обладать самой большой базой ДНК-данных, раз мы такие замечательные. Великий эволюционист Джордж Уильямс обратил внимание на то, что животным со сложным жизненным циклом нужно кодировать развитие всех стадий жизненного цикла, но у них есть на это только один геном. Геном бабочки должен содержать всю информацию, необходимую для построения организма как гусеницы, так и бабочки. В жизненном цикле печеночной двуустки целых шесть стадий, специализированных для разного образа жизни. Нам не стоило бы особенно обижаться, если бы оказалось, что у печеночных двуусток геном больше нашего (на самом деле это не так).
Вспомним также, что даже суммарная емкость той части генома, которая реально используется, не то же самое, что настоящее количество информации в шенноновском смысле слова. Настоящее количество информации — это то, что останется, когда вся избыточность будет удалена из сообщения путем сжатия, с помощью умозрительного эквивалента программы-архиватора. Существуют даже некоторые вирусы, которые, судя по всему, используют что-то вроде такого сжатия. Они пользуются тем, что код РНК (эти вирусы содержат не ДНК, а РНК) считывается триплетами. Имеется “рамка”, которая движется вдоль последовательности РНК, считывая три буквы за один раз. Очевидно, что в обычном случае, если эта рамка начнет считывать код не с того места (как это происходит при так называемых мутациях сдвига рамки считывания), получится полная бессмыслица: “триплеты”, которые она будет считывать, пойдут не в ногу с осмысленными триплетами. Но эти замечательные вирусы научились с успехом пользоваться сдвигом рамки считывания. Они получают два сообщения по цене одного, за счет совершенно другого сообщения, заключенного в той же самой последовательности букв, если считывать ее со сдвигом рамки. В принципе можно получить даже три сообщения по цене одного, но я не знаю таких примеров.
Одно дело — оценить суммарную информационную емкость генома и объем той его части, которая реально используется, и другое — оценить настоящее количество информации в шенноновском смысле слова. Лучшее, что мы можем сделать, это, должно быть, вообще забыть о самом геноме и обратиться к его продукту — фенотипу, рабочему телу животного или растения как такового. В 1951 году Джон Уильям Саттон Прингл, который впоследствии был моим профессором в Оксфорде, предложил использовать меру информации шенноновского типа для оценки “сложности” организма. Прингл хотел выразить сложность математически, в битах, но я давно обнаружил, что для разъяснения его идеи удобно излагать ее в следующей словесной форме.