Шрифт:
Интервал:
Закладка:
Как бы то ни было, для криминалистики здесь существенно только одно: в геноме имеются вариабельные участки. Чем бы ни окончилась дискуссия о том, насколько изменчивы полезные участки генома, в нем так или иначе с избытком хватает областей, которые никогда не считываются и не переводятся в свои белковые эквиваленты. Да-да, поразительно большая часть наших генов, по всей видимости, не делает вообще ничего. Следовательно, они могут видоизменяться сколько им угодно, что делает их превосходным материалом для ДНК-дактилоскопии.
Как будто чтобы специально продемонстрировать нам, что значительная часть ДНК не несет никакой пользы, абсолютное содержание ДНК в клетках организмов разных видов различается самым чудовищным образом. Поскольку информация, записанная в ДНК, является цифровой, мы можем измерить ее в единицах, подобных тем, в каких измеряется информация, хранящаяся в компьютере. Одного бита информации достаточно для обозначения единичного выбора по принципу «да — нет»: 1 или 0, «истина» или «ложь». У компьютера, на котором я печатаю эти строки, 256 мегабит (32 мегабайта) оперативной памяти. (Мой самый первый компьютер был более громоздкой штуковиной, и однако же емкость памяти у него была в пять тысяч раз меньше.) Соответствующей фундаментальной единицей информации ДНК служит азотистое основание нуклеотида. Поскольку возможных разновидностей этих оснований четыре, количество информации, содержащейся в одном основании, эквивалентно 2 битам. Размер генома Escherichia coli — типичной бактерии из нашего кишечника — равен 4 мегабазам (миллионам пар оснований), или 8 мегабитам. А у гребенчатого тритона, Triturus cristatus, геном величиной в 40 000 мегабит. Эта 5000-кратная разница между бактерией и гребенчатым тритоном примерно соответствует разнице между самым первым моим компьютером и нынешним. У нас, людей, геном состоит из 3000 мегабаз, или 6000 мегабит. Это в 750 раз больше, чем у бактерии (что льстит нашему самолюбию), но как быть с тритоном, обставившим нас шестикратно? Хотелось бы думать, что размер генома и его функциональность не находятся в строгой пропорциональной зависимости и значительная часть генома у этого вида тритона попросту ничего не делает. Несомненно, так оно и есть. И то же самое справедливо и для большей части нашей с вами ДНК. Имеются различные подтверждения тому, что только около 2 % от 3000 мегабаз человеческого генома используется для синтеза закодированных в нем белков. Остальное нередко называют мусорной ДНК. У гребенчатого тритона, по-видимому, содержание мусорной ДНК еще выше, чем у нас. У других тритонов — нет.
Эти неиспользуемые излишки ДНК делятся на несколько категорий. Некоторые из них выглядят как настоящая генетическая информация и, вероятно, представляют собой древние, уже неисправные гены либо устаревшие копии тех генов, что и поныне работают. Такие псевдогены, будучи считанными и переведенными в белок, дали бы нечто вразумительное. Но они не считываются и в белки не переводятся. Жесткие диски компьютеров тоже обычно содержат подобный мусор: старые копии находящихся в работе файлов, объем памяти, отведенный под временное хранение данных о разных промежуточных операциях, и прочее. Мы, пользователи, этого мусора обычно не видим, потому что компьютер показывает нам только те части диска, о которых нам необходимо знать. Но если задаться целью и прочесть байт за байтом всю записанную на диске информацию, то нам встретится немало мусора, существенная часть которого будет содержать в себе какой-то смысл. Вероятно, в настоящий момент на жестком диске моего компьютера находятся десятки разрозненных фрагментов этой главы, разбросанных то там, то сям, хотя меня ставят в известность только об одной, «официальной» версии (ну и о предусмотрительно сохраненной резервной копии).
Вместе с ДНК, которую в принципе можно было бы прочесть, хоть этого и не делается, в геноме полным-полно такой мусорной ДНК, которая не только не читается, но в которой и невозможно увидеть ничего осмысленного. Там есть бескрайние участки однообразно повторяющейся околесицы: быть может, какого-то одного азотистого основания, или двух, или же некоего более сложного мотива. В отличие от предыдущей разновидности мусорной ДНК, мы не можем рассматривать эти так называемые тандемные повторы в качестве вышедших из употребления копий полезных генов. Эта повторяющаяся ДНК никогда не бывала декодирована и, предположительно, никогда не была ни для чего нужна. (Во всяком случае, никогда не была нужна для выживания организма. Но, как я разъяснил в другой своей книге, с точки зрения эгоистичного гена можно сказать, что любая разновидность мусорной ДНК «приносит пользу» самой себе, просто если ей удается выживать и увеличивать число собственных копий. Эта идея стала известна под ярлыком «эгоистичная ДНК» — впрочем, не слишком удачным, поскольку обычная, работающая ДНК тоже эгоистична в том смысле, который я вкладываю в данное слово. По этой причине некоторые стали прибегать к термину «ультраэгоистичная ДНК».)
Так или иначе, каковы бы ни были причины ее существования, мусорная ДНК у нас имеется, и в огромных количествах. А поскольку она не используется, ничто не мешает ей меняться. Это у полезных генов, как мы видели, свобода варьирования жестко ограничена. Большинство изменений (мутаций) делают работу гена менее эффективной: животное гибнет — и изменение дальше не передается. В этом и есть суть естественного отбора по Дарвину. Однако мутаций в мусорной ДНК (по большей части это изменения числа повторов на том или ином участке) естественный отбор не замечает. Таким образом, исследуя популяцию, наибольшее разнообразие, подходящее для ДНК-дактилоскопии, мы обнаружим в мусорных областях. И, как нам сейчас станет ясно, особенно в этом смысле полезны тандемные повторы, поскольку в них изменяется число повторяющихся фрагментов — заметный признак, который легко измерить.
Не будь тандемных повторов, судебным генетикам пришлось бы выяснять точную последовательность азотистых оснований на выбранном для анализа участке ДНК. Это можно сделать, но секвенирование ДНК занимает много времени. Однако, как выяснил Алек Джеффрис из Университета Лестера, справедливо считающийся отцом ДНК-дактилоскопии (и ныне сэр Алек), тандемные повторы позволяют нам ловко срезать путь и упростить задачу. На том или ином участке генома у разных людей содержится разное количество этих самых повторов. Например, у меня на определенном участке генома некая бессмыслица может повторяться 147 раз подряд, а на соответствующем участке вашего генома та же самая бессмыслица повторяется, скажем, 84 раза. В другом месте у меня может оказаться 24 копии некой определенной чепухи, а у вас — 38. У любого из нас можно взять уникальный «отпечаток пальца», который будет представлять собой набор чисел. Каждое из этих чисел будет означать, сколько раз та или иная бессмысленная последовательность ДНК повторяется в нашем геноме.
Свои тандемные повторы мы унаследовали от родителей. У каждого из нас 46 хромосом: 23 хромосомы от отца и 23 гомологичные, то есть подобные им, от матери. Мы получаем эти хромосомы целиком, вместе с тандемными повторами. Вашему отцу его 46 хромосом достались, в свою очередь, от его родителей, но он не передал их вам в целостном и неизменном виде. Каждая из хромосом, полученных им от вашей бабки, вытянулась бок о бок со своим дедовским гомологом, и они обменялись участками, после чего одна из двух получившихся комбинированных хромосом попала в сперматозоид, принявший участие в вашем появлении на свет. Каждый сперматозоид и каждая яйцеклетка уникальны, поскольку содержат различную комбинацию фрагментов отцовских и материнских хромосом. Этот процесс перемешивания участков затрагивает в равной степени как тандемные повторы, так и смысловые области генома. Получается, что свое уникальное число для каждого тандемного повтора мы наследуем примерно таким же образом, как цвет глаз или курчавость волос. С той лишь разницей, что цвет наших глаз определяется чем-то вроде совместного вердикта отцовских и материнских генов, а количество тандемных повторов является свойством хромосом как таковых и, следовательно, может быть подсчитано отдельно для каждой хромосомы, полученной нами от кого-то одного из родителей. Для любого участка генома, содержащего тандемные повторы, у каждого из нас имеются два показателя: число повторов на отцовской хромосоме и соответствующее число на материнской. Время от времени хромосомы мутируют: количество имеющихся на них тандемных повторов претерпевает случайные изменения. Также некий конкретный отрезок, содержащий тандемные повторы, может разделиться, когда хромосомы обмениваются своими участками. Вот откуда в популяции возникает разнообразие по числу тандемных повторов. Вся прелесть в том, что эти числа легко определить. Причем нет необходимости связываться с выяснением точной последовательности оснований ДНК — вместо этого производят нечто вроде взвешивания участков с повторами. Или, если использовать другую, не менее подходящую метафору: участки с тандемными повторами рассортировывают, получая что-то вроде цветных полос на выходе из призмы. Сейчас я расскажу про один из способов сделать это.