Шрифт:
Интервал:
Закладка:
Ученые отреагировали на заявления прессы язвительно, жестко и быстро. Одни утверждали, что результаты были неправильно интерпретированы, поскольку химическая активность ДНК в пробирке не означает, что она проявляет функциональную активность в организме. Других возмутил размах проекта – еще один пример работы, которую могут выполнить только гигантские международные сообщества, привлекающие деньги и общественный интерес. А мелкие лаборатории вынуждены заниматься непопулярными проектами, о которых никто не знает и которые никто не финансирует. Отчасти это верно. Политика в науке часто столь же сложна и запутана, как сами данные.
Но часть проблемы опять-таки связана с терминологией. Последовательности ДНК, кодирующие белки, составляют менее 2 % общего объема человеческого генома. Но большая часть остальной ДНК тоже выполняет какую-то работу. Например, это переключатели, которые заставляют включаться и выключаться наши гены, пока мы развиваемся в утробе матери, обеспечивают наши физиологические функции и взаимодействуют с остальной Вселенной. Есть и другие последовательности, которые имеют некую функцию, но мы пока не знаем какую. Мусор ли это? Нет. Зачем нужна эта ДНК? Мы не знаем. Большая часть генома (до 85 %), по-видимому, не подвергается селективному отбору. Многие авторы называют некодирующую ДНК «темной материей генома», сравнивая ДНК с основной массой материи Вселенной, о которой мы пока ничего не знаем.
Мы не знаем, что это такое, но мы знаем, что она существует, поскольку на это указывают наши модели Вселенной. Мне это сравнение очень не нравится. В науке метафоры нужны для того, чтобы прояснять или информировать, а не запутывать. И их не следует использовать только по той причине, что они красиво звучат. По-моему, данная метафора – попытка объяснить одну вещь, которую мы не понимаем, с помощью другой вещи, которую мы тоже не понимаем. Такая метафора еще больше сгущает туман, как будто здесь имеет место не просто научная проблема известных неизвестных, а какая-то тайна. Но в науке нет места тайнам.
Генетические переключатели, структурные элементы, «мусор» и участки с неизвестной функцией составляют практически весь геном. Проект «Геном человека» продвигался непросто, продолжался почти 10 лет и потребовал развития новых технологий, создания компьютеров невиданной мощности и финансовых вложений на сумму три миллиарда долларов США. И вот почему.
Вообразите, пожалуйста, что вот это предложение представляет собой ген.
У него есть структура, и каждое слово выполняет определенную функцию, хотя некоторые слова (например, «пожалуйста») менее важны, чем другие, и без них предложение по-прежнему имеет смысл. Глагол в повелительном наклонении нужен, чтобы привлечь внимание, а существительные «предложение» и «ген» определяют суть. Без них смысл исчезнет или исказится.
Как мы уже видели, при обсуждении ДНК и генов часто используют языковые аналогии, безусловно, по той причине, что в обоих случаях существует алфавит, и порядок букв важен для передачи смысла. ДНК – это текст на основе буквенного кода, который с помощью клеточных механизмов превращается в белок. Жизнь состоит из белков и создается белками. Так что аналогия между языком и генами неплохо работает, но лишь до некоторого предела, в частности, поскольку написанное на этой странице предложение имеет какой-то смысл (я надеюсь). В ДНК смысл не только закодирован, но и записан неочевидным образом. Слепая и медленная эволюция, действовавшая на протяжении миллиардов лет, не пыталась облегчить расшифровку своих законов кому-то из миллиардов своих детей.
В английском языке для облегчения прочтения мы разделяем слова пробелами, но в ДНК нет пробелов и знаков препинания. Так что в форме ДНК наше предложение приняло бы такой вид:
Вообразитепожалуйстачтовотэтоп редложениепредставляетсобойген
Кроме того, гены записаны в геноме не в виде цельных «предложений». Они случайным образом разделены интронами, а места разрыва не имеют отношения к смыслу фразы:
Вообразитепожалу йстачтовотэтопредложе ниепредстав ляетсоб ойген
Фрагменты, несущие смысловую нагрузку, называются экзонами: в нужный момент они раскодируются и превращаются в белок. Интроны и экзоны состоят из одних и тех же четырех букв. Интроны бывают самой разной длины, обычно порядка тысячи нуклеотидов. В нашем примере для простоты я изображу три интрона длиной по 30 букв. Это случайный набор букв, содержащий, однако, символы начала и конца разрыва последовательности. Я использую символы СТОП и СТАРТ, что позволит нам определить, где заканчивается экзон, и начинается и заканчивается интрон.
Вообразитепожал уСТОПАНДРУФТЬЖАППВНЕТВО ОПУСТАР ТйстачтовотэтопредложеСТОПРЕИСВАУКЦРРАПФДЛОТ ТРНСТАРТниепредставСТОПРОТВРНПУЦФ ДЖАТРНЕЕУВТСТАРТляетсобойген
Кроме того, в начале и в конце гена имеются некодирующие последовательности. В начале гена часто приводятся рабочие инструкции, такие как последовательность, с которой связывается ген CHX10.
Чтобы мы с вами не перегрелись, я опять взял последовательность всего из нескольких десятков букв, задал инструкции в виде формулы ФРАЗАНАЧИНАЕТСЯ, а затем поставил слово ПОЕХАЛИ, указывающее начало гена:
Я сохранил строчные буквы в исходном предложении, так что мы по-прежнему можем его увидеть, а инструкции выделил курсивом. Однако в ДНК ничего подобного нет. В геноме все буквы имеют абсолютно равный вес. Поэтому, будь наша формула последовательностью ДНК, она выглядела бы следующим образом:
Найти смысл в этом куске текста достаточно сложно. Теперь вы понимаете, почему чтение генома непростое занятие? Это короткая фраза всего из 215 знаков на знакомом нам языке. А вот фрагмент настоящего гена:
В этом фрагменте 1086 знаков. Умножьте на три миллиона, и вы получите наш геном. Эта конкретная последовательность – маленький фрагмент гена CHX10 с хромосомы 14. На самом деле это именно тот фрагмент, в котором закодирована структура зажима, обхватывающего ДНК. Здесь всего четыре знака, и это лишь кодирующая область, без всяких прерывающих смысловую последовательность интронов. Но, как вы видите, даже в таком виде этот текст непонятен и совершенно неинтересен. Ясно, что для разгадки этой записи существует код, но расшифровать текст можно, лишь зная этот код заранее, – никаких указаний внутри текста не существует. К счастью, генетический код был расшифрован экспериментальным путем (хотя предположения о структуре кода начали появляться сразу после того, как Уотсон и Крик определили строение ДНК). Русский физик-ядерщик Джордж Гамов[94] в 1953 году предложил Крику первую версию трехбуквенного кода. Код был неправильным, но он позволил Крику понять, что происходит на самом деле.