Шрифт:
Интервал:
Закладка:
Изменилось отношение к чтению ДНК и в научном мире: статья не то что о гене, но даже о полном геноме, содержащем тысячи генов, едва ли произведет большое впечатление и удостоится страниц самых известных научных журналов. Разве что речь пойдет о геноме какого-то совершенно уникального организма, чьи генетические данные радикально меняют представление об эволюции жизни на Земле. Как мы пришли к тому, что читать последовательности ДНК стало так легко?
В 1977 году Уолтер Гилберт и Аллан Максам предложили первый метод чтения ДНК[265]. Образец ДНК, содержащий анализируемую последовательность, помещали в четыре пробирки. В каждой из пробирок проводились химические реакции, в ходе которых нуклеотидные последовательности разрезались после разных букв. В первой пробирке молекула ДНК разрезалась после нуклеотидов А или G, во второй — после нуклеотида A, в третьей — после C, а в четвертой — после С или T. В итоге получались фрагменты всевозможной длины. Продукты реакций помещали в четыре параллельные лунки, проделанные внутри специального геля, через который пускали ток.
ДНК — дезоксирибонуклеиновая кислота, а раз это кислота, значит, в растворе она отдает протон и становится отрицательно заряженной молекулой. Поэтому при включении тока молекулы ДНК начинают бежать от отрицательного плюса к положительному. Маленькие молекулы бегут быстрее, чем длинные, которые застревают в геле, и таким образом нарезанные фрагменты ДНК выстраиваются по длине. Эта процедура упорядочивания молекул ДНК при помощи тока называется гель-электрофорезом.
До помещения в лунки ДНК помечалась радиоактивными метками. После электрофореза на гель накладывалась специальная пленка, которая засвечивалась радиоактивным излучением от меченой ДНК, и ученые получали снимок, где были видны четыре дорожки с чередующимися полосами. Глядя на эти полосы, можно было установить последовательность нуклеотидов анализируемого фрагмента ДНК. Давайте представим, как бы выглядел набор полученных полос для следующей последовательности ДНК: GATTACA.
Самый короткий фрагмент заканчивается нуклеотидом G. Он «убежит» вперед и со временем окажется ближе всех к положительному полюсу. После нуклеотида G разрезание происходило только в первой пробирке, поэтому мы видим одну полосу в крайнем левом ряду. Второй по длине фрагмент заканчивается на нуклеотид А. После этого нуклеотида разрезы происходили в первой и второй пробирках, поэтому мы видим полосы в двух левых рядах. Чтение ДНК по таким снимкам напоминало чтение музыкальных нот с листа, только в этом процессе, как правило, участвовало двое ученых: один, глядя на снимок, называл нуклеотиды, а другой записывал букву за буквой.
К сожалению, мы бы скорее успели колонизировать Марс, чем прочитать геном человека, используя этот метод. Человечество нуждалось в более совершенных методах чтения ДНК. В самой крупной базе данных научных публикаций Web of Science находится более 2,3 миллиона статей, в которых упоминается DNA (ДНК). Среди них на первом месте по количеству цитирований — статья, опубликованная все в том же 1977 году в журнале PNAS британским биохимиком Фредериком Сенгером[266]. На эту статью ссылались более 65 тысяч раз! Почти вдвое больше, чем на следующую в рейтинге. Сенгер описал метод «терминации цепи», который произвел настоящую революцию в области чтения ДНК благодаря удобной автоматизации процесса. В основе метода лежат особые «терминирующие нуклеотиды», которые отличаются от обычных тем, что стоит им встроиться в растущую нуклеотидную цепь, и синтез останавливается. Это происходит потому, что у меченых нуклеотидов нет З’-конца, к которому мог бы присоединиться следующий нуклеотид.
Для анализа ДНК по методу Сенгера, как и в случае с методом Гилберта и Максама, нужно было использовать четыре пробирки. Во все пробирки добавлялись анализируемый образец ДНК, ДНК-полимераза и обычные нуклеотиды. Кроме того, в каждую из пробирок добавлялось небольшое количество терминирующих нуклеотидов одного из четырех типов, помеченных радиоактивной меткой. Наконец, в каждую пробирку добавлялись праймеры. Обычно праймеры синтезируются путем последовательного химического соединения нуклеотидов. Они подбираются комплементарными некоторому уже известному участку анализируемой молекулы ДНК, продолжение которой мы хотим прочитать. Без праймеров ДНК-полимераза не может начать синтез.
В каждой из четырех пробирок происходит синтез ДНК, праймеры достраиваются до полноразмерных цепочек, последовательности растут, но как только присоединяется терминирующий нуклеотид, синтез останавливается, и чем раньше это произойдет, тем короче получится фрагмент ДНК. Поскольку терминирующие нуклеотиды представляют небольшую долю от общего числа нуклеотидов в смеси, получаются как короткие, так и длинные фрагменты ДНК. Дальше продукты реакций из четырех пробирок наносятся на гель (каждый в свою лунку), через который пускается ток. Фрагменты выстраиваются по длине, делается снимок радиоактивности, по которому восстанавливается последовательность ДНК.
В 1985 году метод Сенгера был доработан в лаборатории Лероя Худа. Там придумали, как заменить радиоактивную метку на четыре типа флуоресцентных меток: были получены терминирующие нуклеотиды, каждый из которых имел свой цвет[267]. Теперь все реакции можно было проводить в одной пробирке. Поскольку окрашены только терминирующие нуклеотиды, а при их присоединении синтез ДНК останавливается, каждая молекула ДНК будет окрашена в тот цвет, в который был окрашен последний присоединенный к ней (терминирующий) нуклеотид. Как и раньше, терминирующих нуклеотидов добавлялось совсем немного, чтобы получались последовательности всех возможных длин. Эти последовательности разделялись по длине на геле, но дальнейший анализ делала машина, которая самостоятельно считывала цвет каждой полоски на геле и определяла по цвету, какая там буква. Так был создан прибор для автоматизированного чтения ДНК.
В 1980 году Сенгер получил вторую Нобелевскую премию по химии (первая была присуждена ему еще в 1958-м за определение аминокислотной последовательности белка инсулина — первого прочитанного белка), а его метод в различных модификациях еще долгие годы был основным методом чтения ДНК. Сначала с его помощью был прочитан первый ДНК-геном — геном бактериофага 9X174, длиной 5386 нуклеотидов, потом в 1995 году был прочитан первый полный геном клеточного организма, гемофильной палочки Haemophilus influenzae[268], возбудителя пневмонии и менингита. Геном этой бактерии имел длину 1830137 нуклеотидов! В 1998 году был прочитан первый геном многоклеточного животного, круглого червя Caenorhabditis elegans[269] (уже 98 миллионов нуклеотидов!). В 2000-м — первый растительный геном Arabidopsis thaliana[270] (157 миллионов нуклеотидов!). Тем временем уже вовсю шла работа над проектом по чтению генома человека, количество нуклеотидов в котором, как мы уже знаем, около трех миллиардов.