Шрифт:
Интервал:
Закладка:
Эти трудности можно обобщить, сказав, что чтение требует знания, а знание приобретается (по большей части) из чтения. Иными словами, перед нами классическая ситуация с курицей и яйцом. Можно рассчитывать на процесс бутстрэпа — «спасения утопающих силами самих утопающих», — когда система читает какой-нибудь простой текст, получает определенные знания, использует их для чтения более сложного текста, получает дополнительные знания и т. д. К сожалению, на деле происходит противоположное: приобретенное знание оказывается по большей части ошибочным, что вызывает ошибки при чтении, приводящие к еще более ошибочному знанию, и т. д.
Например, проект «Бесконечное изучение языка» (Never-Ending Language Learning, NELL) Университета Карнеги — Меллона является, пожалуй, самым амбициозным проектом бутстрэп-обучения языку, осуществляемым в настоящее время. С 2010 по 2018 г. NELL усвоил более 120 млн утверждений, читая англоязычные тексты в интернете[117]. Часть этих утверждений верна, например, что «Мейпл Лифс» играют в хоккей и выиграли Кубок Стэнли. Помимо фактов NELL постоянно учит новые слова, категории и семантические отношения. К сожалению, он уверен лишь в 3 % своих утверждений и нуждается в экспертах-людях, чтобы регулярно исправлять ложные или бессмысленные утверждения — например, что «Непал — это страна, также известная как Соединенные Штаты», а «ценность — сельскохозяйственный продукт, который обычно режут на базис».
Я подозреваю, что может не произойти единого прорыва, который обратил бы нисходящую спираль вспять. Базовый процесс бутстрэп-обучения кажется правильным: программа, которая знает достаточно фактов, может сообразить, на какой из них ссылается новое предложение, и, таким образом, узнать новую текстуальную форму выражения фактов, что впоследствии позволит ей открыть больше фактов, и так процесс продолжится. (Сергей Брин, сооснователь Google, опубликовал важную статью об идее бутстрэп-обучения в 1998 г.[118]) Безусловно, этому способствует предварительная подготовка в виде большого количества закодированного вручную знания и лингвистической информации. Повышение сложности репрезентации фактов — позволяющей отображать комплексные события, причинно-следственные связи, верования и отношения других и т. д., — а также совершенствование работы с неопределенностью в значениях слов и предложений могут постепенно вылиться в самосовершенствующийся, а не вырождающийся процесс обучения.
Кумулятивное изучение понятий и теорий
Около 1,4 млрд лет назад примерно в 13 секстиллионах километров отсюда две черные дыры, одна в 12 млн раз, другая в 10 млн раз массивнее Земли, сблизились настолько, что стали обращаться вокруг друг друга. Постепенно теряя энергию, они двигались по спирали все теснее и быстрее, достигнув орбитальной частоты вращения 250 оборотов в секунду при расстоянии 350 км, когда, наконец, столкнулись и слились[119]. В последние несколько миллисекунд энергия излучения в форме гравитационных волн в 50 раз превышала совокупную выделенную энергию всех звезд во Вселенной. 14 сентября 2015 г. эти гравитационные волны достигли Земли. Они попеременно растягивали и сжимали само пространство в отношении примерно 1 к 2,5 секстиллионов, что эквивалентно изменению расстояния до Проксимы Центавра (4,4 световых года) на толщину человеческого волоса.
К счастью, за два дня до этого детекторы Advanced LIGO (лазерно-интерферометрической гравитационно-волновой обсерватории) в Вашингтоне и Луизиане были введены в эксплуатацию. Методом лазерной интерферометрии они смогли измерить это ничтожное искажение пространства. С помощью расчетов на основе общей теории относительности Эйнштейна (ОТО) исследователи LIGO предсказали — и поэтому именно ее и искали — точную форму гравитационной волны, ожидаемой при таком событии[120].
Это стало возможным благодаря накоплению и передаче знания и идей тысячами человек в течение столетий наблюдений и исследований. От Фалеса Милетского, натиравшего янтарь шерстью и наблюдавшего возникновение статического заряда, через Галилея, бросавшего камни с Падающей башни в Пизе, к Ньютону, следившему за падением яблока с ветки, и далее, через тысячи других наблюдений, человечество постепенно, слой за слоем, накапливало понятия, теории и устройства: масса, скорость, ускорение, сила, ньютоновские законы движения и гравитации, уравнения орбитального движения, электрические явления, атомы, электроны, электрические поля, магнитные поля, электромагнитные волны, специальная теория относительности, ОТО, квантовая механика, полупроводники, лазеры, компьютеры и т. д.
В принципе, мы можем представить процесс совершения открытия как преобразование всех сенсорных данных, когда-либо полученных всеми людьми, в очень сложную гипотезу о сенсорных данных, полученных учеными LIGO 14 сентября 2015 г., когда они следили за своими компьютерными мониторами. Это понимание обучения исключительно сквозь призму данных: данные на входе, гипотеза на выходе, посередине черный ящик. Если бы это работало, это был бы апофеоз подхода к разработке ИИ на основе глубокого обучения — «большие данные, большие сети», — но это невозможно. Единственная жизнеспособная идея, имеющаяся у нас о том, как интеллектуальные системы могли бы прийти к такому колоссальному достижению, как регистрация слияния двух черных дыр, состоит в том, что предшествующее знание физики в сочетании с наблюдаемыми данными позволило ученым LIGO вывести заключение, что произошло слияние. Более того, это предшествующее знание само по себе было результатом обучения на основе предшествующего знания, и так далее, вглубь истории на всем ее протяжении. Итак, у нас есть приблизительная кумулятивная картина того, как интеллектуальные системы могут обретать прогностические возможности, используя знание как строительный материал.
Я говорю «приблизительная», поскольку, разумеется, за столетия наука иногда сворачивала не в ту сторону, временно увлекаясь погоней за такими иллюзорными феноменами, как флогистон и светоносный эфир. Однако мы достоверно знаем, что кумулятивная картина есть то, что действительно произошло, в том смысле, что ученые постоянно описывали свои открытия и теории в книгах и статьях. Последующие поколения ученых имели доступ лишь к этим формам эксплицитного знания, а не к исходному сенсорному опыту предшествующих, давно ушедших поколений. Будучи учеными, члены команды LIGO понимали, что все фрагменты знания, которым они пользуются, включая ОТО Эйнштейна, находятся (и всегда будут находиться) в периоде апробации и могут быть сфальсифицированы в результате эксперимента. Как оказалось, данные LIGO предоставили убедительное подтверждение ОТО, а также дальнейшие свидетельства того, что гравитон — гипотетическая частица гравитации — не имеет массы.