Шрифт:
Интервал:
Закладка:
Итак, среди трех миллиардов букв человеческой ДНК спрятано около 20 тысяч генов всех размеров, разделенных множеством интронов. Каждый ген занимает определенное место на одной из хромосом. У нас 23 пары хромосом, доставшихся нам от обоих родителей. Каждая хромосома содержит тысячи генов, но гораздо больше наполнителя. Когда в 1994 году Ли Роуэн разместила в открытой базе данных первый отсеквенированный отрезок человеческой ДНК длиной более 500 тысяч знаков, это был просто массив данных, не доступный для анализа с помощью обычных компьютеров.
Предстояла колоссальная работа. Пока мощность компьютеров не достигла такого уровня, который позволял отыскивать в геноме информативные фрагменты ДНК, вся эта работа напоминала поиски иголки в стогу сена. Представьте поле с 50 гигантскими стогами сена длиной по 100 метров. А теперь представьте 600 тысяч таких полей. И вам нужно найти в этих стогах 20 тысяч иголок. Причем иголки сделаны не из металла, а из того же сена, и разъединены на отдельные кусочки.
Однако эта работа была выполнена. С середины 1990-х годов технология начала развиваться с невероятной скоростью, и появились новые методы быстрого секвенирования. Один из наиболее популярных методов называется «методом дробовика» (shotgun sequencing); он состоит в том, что множество копий длинных фрагментов ДНК разбивают на тысячи случайных кусочков меньшего размера, и их секвенируют. Читать короткие фрагменты гораздо проще, чем длинные, а во множестве случайных фрагментов обязательно найдутся перекрывающиеся участки, что позволит воспроизвести исходную последовательность ДНК.
Двадцать шестого июня 2000 года политические игры большой науки увенчались успехом: была составлена первая карта человеческого генома. Президент Билл Клинтон выступил перед представителями международной прессы в Белом доме. С одной стороны от президента стоял руководитель проекта Фрэнсис Коллинз, с другой – руководитель частной компании, занимавшейся тем же делом, Крейг Вентер. У них за спиной на экране виднелась голова британского премьер-министра Тони Блэра, символизировавшая британское участие в проекте. Вот что сказал Клинтон по поводу первого генома: «…это самая удивительная карта, когда-либо созданная человеком… Сегодня мы изучаем язык, посредством которого Бог создал жизнь».
Думаю, для людей любого вероисповедания это заявление звучит слишком прямолинейно, и, вообще говоря, оно не совсем справедливо. Как выяснили ученые, большая часть генома – вообще не язык, который можно перевести. Смысловую нагрузку несут только гены, а все остальное либо используется как-то иначе, либо не используется вовсе. Язык генов мы разгадали уже несколько десятилетий назад, а вот разобраться в невообразимом хаосе остального материала было значительно труднее.
Я помню тот день очень отчетливо. Я не участвовал в попытках постичь божественный язык. В это время я работал над диссертацией и пытался найти в так называемом «полном геноме человека» интересовавший меня ген CHX10. Я обнаружил место на хромосоме 14, где могла располагаться большая часть гена, но далеко не все, и я не знал направления гена. В отличие от текстов, например, на английском языке, которые читаются слева направо, гены могут читаться в любом направлении: .иинелварпан мобюл в ясьтатич тугом ынег, оварпан авелс ястюатич еыроток, екызя моксйилгна ан, ремирпан, вотскет то еичилто В. Тысячи ученых всего мира находились в одинаковом положении, разыскивая «свои» гены или фрагменты ДНК, с которыми они взаимодействуют. Да, база данных давала ключ к поискам, но в 2000 году она была еще неполной и запутанной. Я нашел нечто напоминавшее CHX10 на другой хромосоме и потратил довольно много времени, пытаясь определить начало, конец и возможную функцию этой ДНК. Но однажды на моем столе оказалась статья, опубликованная исследователями из другой лаборатории, в которой этот фрагмент был расшифрован полностью. Вот такие дела.
Если это божественный язык, Богу не помешало бы обратиться к хорошему редактору. Расшифровка генома – выдающееся событие, и, я думаю, выступление президента было вполне уместно. Пожалуй, такие мероприятия в честь научных достижений нужно бы проводить почаще, поскольку это привлекает внимание (и финансовые средства) со стороны общественности. Однако прочтение генома не было завершено. На самом деле работа была очень далека от завершения. Эту версию в лучшем случае можно было считать черновиком.
Работа не была закончена в феврале 2001 года, когда журнал Nature опубликовал формальный отчет о проекте. Она не была закончена в апреле 2003 года, когда было официально заявлено о завершении проекта и расшифровке 99 % ДНК, содержащей генетическую информацию. Та же ситуация наблюдалась и в мае следующего года, когда проверка подтвердила точность полученных данных (но это касалось лишь 92 % всей ДНК). Сегодня результаты проекта «Геном человека» существуют в виде так называемого референсного генома – некой репрезентативной последовательности для проведения сравнительного анализа, которая время от времени обновляется.
Работа по секвенированию генома стала стимулом для появления новых инструментов и методов анализа ДНК. Следующим большим проектом был проект HapMap, цель которого заключалась в сканировании ДНК людей со всего мира для идентификации различий между большими группами людей и индивидуальными вариациями внутри этих групп, которые могли бы повышать риск развития тех или иных заболеваний или появления тех или иных признаков. Как мы видели, аналогия с буквами, книгами и языком часто применяется для описания ДНК, и это вполне оправдано. Из букв строятся слова, из слов предложения, из предложений абзацы и т. д. При печати буквы могут чуть заметно или довольно сильно изменяться, так что фраза принимает совершенно противоположный смысл (знаете, как полностью меняется смысл от постановки запятой во фразе «казнить нельзя помиловать»). А какие-то замены ни на что не влияют. Большинство книг при переизданиях практически не меняется, а многие живут недолго: их судьба – сохраняться на полках в библиотеке. Но есть и другие примеры: исходная версия слова Божьего, Библия, переводилась и переписывалась бесконечное число раз на протяжении нескольких тысяч лет. В ней хранится важная культурная информация, иногда изложенная поэтическим языком, и поэтому ее изучают и пересматривают. И в этом деле, как в генетике, точность перевода имеет первостепенное значение.
Например, в ранних версиях Книги пророка Исайи, написанной на древнееврейском, есть пророчество, в котором использовано слово almah. Это слово относилось к матери мальчика по имени Эммануил, которое (имя) можно перевести как «с нами Бог». Слово almah не имеет прямого перевода ни в английском, ни в древнегреческом, но в целом означает «молодая женщина» или «женщина, не имеющая детей». Во времена Иисуса евреи говорили на греческом или арамейском, но уже не на древнееврейском. Слово almah превратилось в греческое parthenos, которое имеет более узкий смысл и означает «девственница». Отсюда берет начало хороший биологический термин «партеногенез», который означает рождение потомства у некоторых насекомых и пресмыкающихся без участия самцов – «непорочное зачатие». Так, в результате изменения одного-единственного слова, женщина стала Девой, ребенок стал Мессией, и история Иисуса кардинальным образом изменилась. Матфей и Лука в Новом Завете провозглашают это истиной, миллиард католиков произносит это в виде слов молитвы, и все мы поем об этом в Рождество.