Шрифт:
Интервал:
Закладка:
Авторы учли, как влияют на внешность пол человека и его расовая принадлежность. Антропологи задолго до всех этих наших ДНК хорошо умели “отличать череп негра от черепа эскимоса”, как говорится в “Собаке Баскервилей”, и установили, какие значения может принимать тот или иной признак у представителя определенной этнической группы. И в большинстве случаев (хотя и не во всех), когда мы видим человеческое лицо, то угадываем, женское оно или мужское, без подсказок в виде усов или косметики, – по таким неочевидным признакам, как форма скул и подбородка. Пол можно установить по ДНК, как и расовую принадлежность предков, так что жульничества тут нет – никаких дополнительных данных, кроме образца ДНК, не понадобится. И самое интересное – авторы определили однонуклеотидные полиморфизмы в 20 генах, предположительно отвечающих за строение черепа и лица, и сопоставили их с 3D-изображениями. Программе, “переварившей” все эти данные, было предложено реконструировать лица по генотипам, но авторы подчеркивали, что о полном успехе говорить рано.
Вентер с коллегами подошли к задаче несколько по-иному. Они собрали образцы ДНК у 1061 жителя окрестностей Сан-Диего возрастом от 18 до 82 лет. Среди участников исследования оказались 569 представителей африканских этнических групп, 273 латиноамериканских, 63 европейских, 63 восточноазиатских и 18 южноазиатских, а также 75, не принадлежащих ни к одной из этих групп. Для каждого человека получили 3D-изображения, записали образцы голоса (есть данные о связи между голосом и чертами лица – звучит странно, но, в конце концов, то и другое формируется под действием гормонов), количественно измерили цвет глаз и кожи, отметили возраст, рост и вес, а также сделали полногеномное секвенирование. Реконструировать внешние признаки по геномным данным предполагалось с помощью алгоритмов машинного обучения. Программа должна была выдать черты лица, голос, возраст, рост и вес, индекс массы тела, цвет глаз и кожи. (Возраст определяли по длине теломер и мозаичным потерям одной из Х-хромосом у женщин и Y-хромосомы у мужчин.)
Что же в итоге? Цвет глаз, кожи и, разумеется, пол предсказывали точно, “однако для комплексных признаков наша модель объясняла лишь малую часть наблюдаемых фенотипических вариаций”, как деликатно выразились авторы. Не получилось предсказать по геному цвет волос и вероятность облысения.
Фактически людям из Human Longevity удалось сделать следующее. Они выбирали из своей тысячи участников небольшие подгруппы – скажем, 10 человек, затем брали один из десяти геномов и пытались угадать, кому из десятки он принадлежит, сопоставляя результат реконструкции с реальными портретами. Угадывали для десятки с вероятностью около 74 %, причем результаты предсказуемо ухудшались, если подгруппа была этнически однородной – состояла, например, только из африканцев или только из европейцев. Результат гораздо лучше, чем при случайном выборе, но до “опознания по фото” отсюда еще далеко.
Со временем, считают авторы, точность предсказаний будет расти, когда мы узнаем больше о признаках, определяющих черты лица и в том числе о низкочастотных вариантах, связанных с редкими фенотипами. Возраст можно будет предсказать точнее по метилированию генома. Правда, есть еще одна проблема: для полногеномного секвенирования пока что требуется порядка 100 нг ДНК, а на месте преступления обычно находят гораздо меньше, если нет следов крови или спермы. Так что старый добрый PCR-анализ на STR еще не скоро сдаст позиции.
Несмотря на все эти оговорки, результаты и выводы Вентера и соавторов сразу же были подвергнуты критике. Самым активным и язвительным был уже упоминавшийся Янив Эрлих из университета Колумбии. Человек он резкий, ведет “Твиттер”, в котором, невзирая на лица и регалии, высказывается об ошибках и недомыслии ученых коллег. Собственно, у него самого с регалиями дело обстоит неплохо.
Эрлих знает толк в защите информации и ее слабых местах. В середине 2000-х гг. он работал в израильской фирме, которая занималась обеспечением безопасности финансовых учреждений. И позднее, когда он заинтересовался безопасностью геномов, журналисты с удовольствием вспоминали тот период его жизни. Даже Nature дополнил рассказ о нем видеороликом 2006 г., где совсем молодой Янив Эрлих в худи с надвинутым капюшоном заходит, как к себе домой, в отдел ИТ крупного банка, обманывая считыватель отпечатков пальцев с помощью тонового набора на мобильном телефоне. А напоследок еще оборачивается на камеру и весело разводит руками: полиция кончается там, где начинается Беня![168] Повезло нам, что этот человек на стороне Света.
В области геномной безопасности Эрлих проделывает, по сути, то же самое: эффектно демонстрирует, где в этой безопасности дыры; об одной такой демонстрации с применением базы данных MyHeritage мы рассказывали. В сентябре 2017 г. эта работа еще не была опубликована, но Эрлих и тогда уже был признанным авторитетом в этой области. Именно он в свое время язвительно откомментировал заявление гейдельбергской European Molecular Biology Laboratory о том, что из опубликованного генома знаменитой клеточной линии HeLa якобы нельзя извлечь никакой информации о Генриетте Лакс (женщине, которой принадлежала опухолевая ткань, ставшая источником клеток) и ее потомках. “Мило врет EMBL!” – написал он в “Твиттере”. И в итоге EMBL пришлось признать правоту вредного биоинформатика.
Так вот, усилия команды Вентера его не впечатлили. По мнению Эрлиха, не стоит срамиться с портретами по ДНК, пока их точность драматически уступает другим методам деанонимирования генома – тому же поиску в генеалогических базах. Через STR Y-хромосомы становится все проще выйти на фамилию человека или, по крайней мере, на его родственников по мужской линии, так зачем тратить усилия на эффектный, но неработающий способ? Чем-то это напоминает старый анекдот про идентификацию человека по аудиозаписи голоса: “Покажите, как это работает!” – “Очень просто. Четко назовите в микрофон ваши имя, отчество и фамилию”.
Чтобы продемонстрировать наглядно, насколько скромны успехи Вентера и соавторов, Янив Эрлих опубликовал на сервере bioRxiv критический отзыв буквально через день после публикации Вентера. Этот момент сам по себе примечателен: темп научных дискуссий стал стремительным как никогда. Раньше после публикации в рецензируемом журнале критического ответа приходилось ждать месяцы, если не годы, не говоря о том, что критику менее охотно принимают к публикации, чем результаты с “положительным” содержанием. Спасибо bioRxiv и социальным сетям, теперь тот, кто опубликовался в журнале первого ряда, уже не чувствует себя “в домике”: критика мгновенно появляется в общем доступе, а если критикует известный человек, это способно здорово отравить успех.
Вот что пишет Янив Эрлих о результатах команды Вентера: “Я достиг той же точности идентификации внутри вентеровской когорты за 10 минут работы без всякой затейливой лицевой морфологии и цифровых сигнатур голоса. Вместо этого я использовал простую процедуру реидентификации, основанную на базовой демографической информации: возраст, пол, названная самим человеком этническая принадлежность”. Все эти данные не принадлежат к числу закрытых.