Шрифт:
Интервал:
Закладка:
К 2008 году команда 454 проделала 147 запусков по девяти библиотекам, приготовленным из образцов Vi-33.16. Так что было в результате получено 39 миллионов отсеквенированных фрагментов. Цифра внушительная, без сомнения, но я надеялся, что к этому времени у меня уже будет больший объем отсеквенированной ДНК. С таким набором данных мы и думать не могли подступиться к составлению генома. Тем не менее очень хотелось отработать сам алгоритм картирования. Поэтому мы затеяли гораздо менее масштабное предприятие по реконструированию митохондриального генома. Ведь чем мы, да и другие тоже, располагали до того момента? Всего 800 нуклеотидов одного из вариабельных участков неандертальского мт-генома. А нам хотелось иметь его целиком, все 16 500 нуклеотидов.
Эд Грин принялся просеивать 39 миллионов прочтенных фрагментов ДНК; он решил сложить вместе кусочки, напоминавшие последовательности мт-генома современных людей. Затем нужно было сравнить их и, обнаружив перекрывающиеся участки, наложить друг на друга. И так шаг за шагом выстраивалась неандертальская последовательность. Затем он снова прошерстил 39 миллионов фрагментов, но уже ориентируясь на проступающую неандертальскую цепочку. Этот новый поиск выявил фрагменты, упущенные на первом этапе. Ему удалось идентифицировать 8341 митохондриальный фрагмент неандертальца, в среднем длиной в 69 нуклеотидов. Из них получилась полная цепочка молекулы мтДНК в 16 565 нуклеотидов – самая длинная из когда бы то ни было реконструированных мтДНК.
Глядя на результат, совершенно конкретный, осязаемый, я испытывал чувство удовлетворения, пусть даже анализ этого генома не открыл ничего нового о неандертальцах. Зато мы поняли кое-что существенное о технических особенностях методик. Например, число фрагментов, относящихся к определенным участкам генома, неодинаково. Как выяснил Эд, оно зависит от относительного количества Г и Ц по сравнению с А и Т. Иными словами, те фрагменты, где Г и Ц больше, сохраняются в кости лучше, чем те, где превалируют А и Т. Или, возможно, не в кости, а у нас в экстрактах. Но самое прекрасное, что никакие части мт-генома не потерялись. У меня появилось ощущение, что нам теперь подвластны технические трудности анализа древней ДНК. Мы также выявили 133 позиции, по которым мт-ДНК неандертальцев отличалась от мтДНК современных людей[59]. До того нам были известны лишь три такие позиции, приходящиеся на те короткие фрагменты, которые мы реконструировали в 1997 году. А ведь с этими 133 отличиями мы могли бы по-настоящему надежно оценить уровень загрязнений в наших новых данных. Получилось 0,5 процента. Мы даже вернулись к старым данным эксперимента 2006 года из Nature и к дополнительным экспериментам по этой статье (к тем, что мы проделали, пока статья лежала на рецензии). Из 75 митохондриальных фрагментов 67 соответствовали неандертальским вариантам. Так что получилось 11 процентов загрязнений в наших библиотеках: мы рассчитывали на меньший процент, но ведь это и не те 70–80, которые пророчили Уолл и Ким. Мы собрали всю эту информацию и включили ее в статью для журнала Cell, где в 1997 году опубликовали наши первые результаты по неандертальским генам. И снова мы подчеркнули, что прямое тестирование на загрязнения в ядерных генах послужило бы лучше. На пятничных собраниях эта тема – как тестировать ядерные загрязнения – стала звучать все настойчивее.
Когда сбор данных для этой статьи был закончен, на первый план снова вышли проблемы с секвенированием неандертальского материала. “Не слишком ли мы медлительны?” – беспокоился я. Шел уже второй год проекта, и от публикации предварительных результатов – тех самых 3 миллиардов нуклеотидов, которые мы так громко пообещали, – нас отделяло всего несколько месяцев. Из-за этого наши пятничные собрания проходили очень напряженно. Я стал громогласным и язвительным (о чем очень потом сожалел), раздражался из-за некоторых бессодержательных споров или из-за не слишком лаконичного изложения текущего положения лабораторных дел. Но в действительности под всем этим лежало мое внутреннее ощущение, что двигаемся мы чересчур медленно. Частично наша медлительность объяснялась низким содержанием неандертальской ДНК в полученных библиотеках, но также, со всей очевидностью, и невысокой производительностью 454. В марте 2007 года компания 454 была продана фармацевтическому гиганту Roche. И хотя Майкл Эгхольм оставался целиком и полностью в нашем проекте, но те, кто занимался непосредственно секвенированием наших образцов, к осени уволились. Я подозревал, что Эгхольму и его коллегам непросто отдавать все внимание неандертальским делам. У меня впервые появился соблазн обратиться к конкурентам 454.
Одним из таких конкурентов был Дэвид Бентли, очень грамотный генетик, специалист по человеческому геному. Я встречался с ним на конференции в Колд-Спринг-Харбор в мае 2007 года. В 2005- м он перешел из Института Сэнгера под эгидой Wellcome Trust в компанию Solexa, недавно образованную на базе химического факультета Кембриджского университета. В Solexa он заведовал отделом разработки секвенаторов, представлявших серьезную конкуренцию даже ротберговской 454. В Solexa тоже прикрепляли к концам молекул адаптеры и эти фрагменты с адаптерами использовали для изготовления библиотек, амплификации и секвенирования. Но в отличие от 454 в Solexa амплификация производилась не внутри жировых капелек, а на стеклянных шариках: к их поверхности и прикреплялись адаптеры с цепочками ДНК. И получалось, что каждая молекула, осевшая на стеклянной поверхности, умножалась и вокруг нее образовывалось пятно, или кластер, с миллионом ее копий. Эти кластеры затем секвенировались с помощью добавления праймеров, ДНК-полимеразы и четырех нуклеотидов в достаточном количестве; каждый из четырех типов нуклеотидов метился своей флуоресцентной краской.
Первые пробные секвенаторы этого типа поступили в технологические центры в 2006 году. С их помощью можно было отсеквенировать фрагменты длиной в 25 нуклеотидов, а кроме того, как я слышал, они все время ломались. Но в принципе их потенциал был исключительно высок, потому что они обещали одновременное чтение не сотен или тысяч отдельных нитей, как в 454, а сразу нескольких миллионов. А в перспективе, когда технология будет отлажена, даже больше. Вскоре длина читаемых фрагментов увеличилась до 30 нуклеотидов, и пошли разговоры о некоем усовершенствовании, которое позволит читать нить сразу с двух сторон, так что общая длина может достигнуть 60 нуклеотидов. Это уже звучало интереснее для нас, исследователей древних ДНК. И другие стали обращать внимание на эти секвенаторы. В ноябре 2006- го биотехнологическая компания Illumina с базой в США перекупила Solexa, и Дэвид Бентли стал в этой обновленной компании заведующим по науке и вице-президентом.
На конференции в Колд-Спринг-Харбор я обсуждал с Дэвидом наш проект. Мы договорились, что я пошлю ему наши материалы с мамонтовыми или неандертальскими ДНК и он на них протестирует работу машин Illumina. Вообще-то мы даже уже начали потихоньку такое тестирование. В феврале 2007 года мы послали один из лучших экстрактов мамонтовой ДНК Джейн Роджерс в Институт Сэнгера, в Кембридж, а она как раз отвечала там за секвенаторы Solexa. Но к тому моменту она еще не откликнулась, поэтому, вернувшись с конференции, я принялся нетерпеливо забрасывать коллег из Сэнгера запросами. И вот в начале июня пришли результаты, которые нас несколько разочаровали. Эти технологии явно генерировали много ошибок. Компания изо всех сил работала над усовершенствованием технологий, но, кроме того, я понял, что большое число ошибок можно скомпенсировать огромным числом прочтенных фрагментов. В принципе можно попросту каждый фрагмент из библиотеки прочитать много раз, и тогда ошибки секвенирования будут хорошо видны, и их можно будет не учитывать при интерпретации. У Illumina, к сожалению, не было своего центра по секвенированию, поэтому нам пришлось покупать собственную машину. Из-за высокой востребованности этой технологии мы смогли получить ее только полгода спустя. Теперь машина могла читать уже 70 нуклеотидов, правда, все с тем же количеством ошибок. Их число возрастало по мере удлинения читаемой последовательности. В 2008 году новые поколения машин позволяли секвенировать с обоих концов цепочки каждый фрагмент из наших библиотек. Считая, что в древней ДНК фрагменты состоят примерно из 55 нуклеотидов, каждый фрагмент можно прочесть дважды, с одной и с другой стороны. А значит, практически для каждого фрагмента мы получим надежную последовательность.