Шрифт:
Интервал:
Закладка:
За последние годы в нескольких исследованиях предпринимались попытки установить связь между структурой молекул и их запахом путем анализа больших массивов данных. В рамках этих исследований с помощью искусственного интеллекта были созданы компьютерные модели обонятельных стимулов, которые могли бы прояснить связь между химией и психофизикой. Этот подход также ознаменовал появление нового поколения ученых среди специалистов по обонянию.
Как замечает Андреас Келлер, проверка новых методов для решения старых проблем не требовала больших усилий: «Было очевидно, что нужно пробовать». Его коллега Пабло Мейер соглашается: «Есть лишь пара очевидных вещей, которые нужно сделать. Я имею в виду, почему бы их не сделать?» Джоэль Мейнленд считает, что такие методы, как машинное обучение, способствовали этому сдвигу, что также отражало теоретико-познавательный разрыв с традицией: произошел переход от объяснения к предсказанию. Машинное обучение представляет собой «новый набор методов, которые еще не были усвоены этой сферой исследований».
Компьютерные технологии обещали вскрыть код носа с помощью более сложных методов, большего количества данных и лучших методов их обработки. Нейроинформатик Рик Геркин считает: «Вы можете ответить на частные вопросы здесь и там, но чтобы ответить на вопросы такого плана, как размерность пространства в обонятельном восприятии или количество существующих запахов, нужно иметь много данных, а для сбора значительного объема данных нужно много времени, это стоит немалых денег, а большинство мест, где изучают обоняние и психофизику обоняния – это скромные лаборатории, которые не могут позволить себе ответы на эти вопросы». Одной из серьезных проблем новых компьютерных исследований были данные. Как заметила Лесли Воссхолл, «большая часть теоретических работ [в области обоняния] была основана на одном наборе данных тридцатилетней давности. Почему никто их не обновил?» Этот старый набор данных назывался «Атлас характеристического профиля запахов» (см. главу 3). Как рассказывает Воссхолл, Эндрю Дравнек «в начале 80-х составил большой список для использования на северо-востоке Соединенных Штатов для людей, родившихся в период демографического взрыва. Но очень многие слова из этого списка не имеют смысла для тех, кто принимал участие в наших исследованиях». – И добавляет: «Все подобные списки… стареют, очень сильно зависят от культурной среды и работают на определенном историческом этапе и для конкретной целевой аудитории».
Еще одна проблема «Атласа» Дравнека – в недостатке методологии его психофизики. Дравнек подбирал описания самостоятельно. В компьютерных исследованиях, отражавших семантику «пространства признаков запаха» через словесные описания Дравнека, не было практических экспериментов по психофизике человека. Иными словами, они отражали пространство признаков запаха «по Дравнеку». Компьютерные методы исследований связи структуры вещества и его запаха имели те же недостатки, что и старые методы: они убирали биологию системы в черный ящик. А если бы в них были реальные психофизические данные?
Именно это было показано в статье Андреаса Келлера, Лесли Воссхолл и Пабло Мейера, опубликованной в 2017 году в журнале Science[271]. Статья примечательна по нескольким причинам. Во-первых, в ней использовались новые конкретные психофизические данные о реакции людей на запахи, взятые из обширного исследования, опубликованного в 2016 году (также Келлером и Воссхолл)[272]. Во-вторых, это был значительный массив данных. Ценность данных по обонянию человека нельзя переоценить. Келлер и Воссхолл работали с 49 участниками, которые понюхали и описали не менее 476 молекул (с помощью 19 семантических идентификаторов и рейтингов интенсивности и приятности). Келлер и Воссхолл проверили большой набор одорантов на необычно большом количестве участников (для такой слабо финансируемой области, какой является обоняние). «Это была удивительно скучная работа, – смеется Келлер. – Вы даете людям вещество и спрашиваете, чем оно пахнет. Трудно придумать что-нибудь менее интересное. Описательная наука в чистейшем виде. Но это было нужно. Так что мы сорвали яблоко и попробовали его».
В-третьих, статья замечательна по той причине, что отражает такой современный подход к научному сотрудничеству, как краудсорсинг[273]. В работе, опубликованной в Science в 2017 году, психофизические данные 2016 года были обработаны с помощью алгоритмов машинного обучения для выявления связи между структурой и запахом. Эксперимент строился следующим образом. Сначала подбирали добровольцев в рамках программы DREAM Challenges (открытая интернет-платформа для исследователей с описанием научной проблемы, в которой могут принять участие все желающие). Задача была достаточно понятной: найти алгоритм, описывающий два набора данных – список химических параметров молекул и результаты психофизического исследования 2016 года. Затем участникам выдали некоторое количество данных, на которых они могли проверить и настроить свои алгоритмы до представления окончательной версии. Келлер смеется: «В этом и заключалась задача: я составил набор данных, мы разделили их на две части и половину предоставили участникам. И спрашивали: если одно вещество пахнет так, предскажите, как будет пахнуть другое». Результаты, полученные с помощью двух лучших алгоритмов, были опубликованы, но сами алгоритмы – нет.
Победителями стали биоинформатик Юйфэн Чжан, который также выиграл несколько конкурсов по подбору алгоритмов для описания наборов данных из самых разных областей, и Рик Геркин, о котором мы уже упоминали. Следует подчеркнуть, что статья Келлера от 2017 года – до сих пор самый удачный пример использования больших массивов данных в области обоняния; она служит отправной точкой для аналогичных проектов в будущем.
И все же алгоритм – не объяснение. Статья «Предсказание восприятия запахов человеком на основании химической структуры молекул запаха» – важный пример поиска данных и подтверждение ряда существующих гипотез о значении элементов химической структуры. Однако коэффициент корреляции в этом исследовании был сравнительно низким – 0,3. Так что проект DREAM Challenges не привел к расшифровке кода носа.
На результаты работы, отчасти из-за привлекательности подхода с использованием больших массивов данных, обратили внимание научные журналисты, такие как писатель Эд Йонг[274]. Кроме того, исследование вызвало осторожную критику со стороны экспертов, в частности, Эйвери Гилберта. Беспокойство Гилберта касается не этого конкретного исследования, а компьютерного подхода к исследованиям обоняния в целом. Он указывает на отсутствие психологической теоретической базы. Словесное описание – это субъективный критерий для формирования перцептивных категорий. Обзор Гилберта показывает, насколько все еще разобщена эта сфера деятельности, поскольку биоинформатики в нейробиологии моделируют ощущение запаха почти в полном отрыве от когнитивной психологии.
Гилберт подчеркивает, что обонятельное пространство остается пространством неизвестного: «Если кто-то хочет предсказать, какие молекулы могут пахнуть сандаловым деревом или лимоном, ему нужно заново протестировать все 476 молекул на других 49 участниках с помощью нового списка идентификаторов, а затем вернуться к компьютерному моделированию с новым набором данных»[275]. И почему взяли именно эти девятнадцать описаний? Воссхолл отвечает: «Причина, почему мы использовали в работе эти девятнадцать, в