Шрифт:
Интервал:
Закладка:
Сын специалиста по тропическим болезням и медицинской антропологии, Джефф Дин еще в детстве объездил весь мир. С Гавайев, где он родился, профессиональный долг призвал его родителей в Сомали, где он, будучи школьником, помогал в лагере беженцев. Старшие классы школы он посещал уже в Атланте, штат Джорджия, где его отец работал в одном из центров по контролю и профилактике заболеваний (CDC). Тогда же Джефф создал для них программный инструмент115, который помогал исследователям собирать данные о болезнях и который почти четыре десятилетия спустя остается основным подспорьем для эпидемиологов развивающихся стран. После окончания аспирантуры, где он изучал программирование низкого уровня – так называемые компиляторы, которые переводят программный код на язык, понятный компьютеру, – он попал в научно-исследовательскую лабораторию Digital Equipment Corporation, а когда могущество этого бывшего гиганта компьютерной индустрии стало таять, оказался в числе лучших сотрудников DEC116, которые перебрались в Google – как раз в то время, когда компания стремительно расширялась. Первоначальный успех Google часто связывают с PageRank, алгоритмом поиска, который был разработан Ларри Пейджем, когда он и Сергей Брин, второй соучредитель Google, были аспирантами в Стэнфорде. Но стройный, с квадратной челюстью, классический красавец Дин, разговаривавший с вежливой застенчивостью и слегка шепелявивший, внес не меньший – если не больший – вклад в быстрый рост компании. Он и несколько других инженеров создали мощное программное обеспечение для поисковой системы Google, программы, которые управляли тысячами серверов и несколькими центрами обработки данных, позволяя PageRank мгновенно и ежесекундно обслуживать миллионы людей. «Его главным достижением было создание системы из миллионов компьютеров, которые работали как одно целое, – говорит Себастьян Трун. – В истории вычислительной техники этого еще никто никогда не делал».
Среди инженеров Дина уважали как мало кого в Кремниевой долине.
«Когда я был молодым инженером, о нем разговаривали за обедом. Мы сидели и говорили о его могуществе, – вспоминает Кевин Скотт, один из первых «гуглеров», который впоследствии стал техническим директором Microsoft. – У него была эта сверхъестественная способность докапываться до первичной сути сложнейших технических вопросов». Однажды к первому апреля117 – а День дурака был священным событием в компании в первые годы ее существования – во внутренней корпоративной сети появилась страничка с перечислением «Фактов о Джеффе Дине». Это была пародия на «Факты о Чаке Норрисе», популярный в интернете шутливый список достижений этой звезды боевиков 1980-х:
Джефф Дин однажды провалил тест Тьюринга, когда правильно определил 203-е число Фибоначчи быстрее чем за секунду.
Джефф Дин компилирует и прогоняет свои программные коды перед отправкой, но только для того, чтобы проверить на ошибки компилятор и процессор.
ПИН-код Джеффа Дина – последние 4 цифры числа пи.
Раньше скорость света в вакууме составляла около 35 миль в час. Затем Джефф Дин за выходные оптимизировал физику.
Остальным «гуглерам» предлагалось118 добавлять свои собственные факты, и многие включались. Кентон Варда, молодой инженер119, создавший этот сайт, старательно скрывал свою личность, но, собрав воедино несколько цифровых подсказок, спрятанных в журналах Google’овских серверов, Дин раскрыл его и послал ему благодарственную записку. То, что начиналось как первоапрельская шутка, переросло в мифологию Google120, легенду, часто пересказываемую как в стенах компании, так и за ее пределами.
Эндрю Ын знал, что Джефф Дин привнесет в его проект такой уровень технических знаний и опыта, каким мало кто обладал, а также политический капитал, который обеспечит проекту необходимую поддержку внутри компании. Так что их встреча на мини-кухне – когда Дин спросил, что Ын делает в Google, а Ын шепотом ответил, что строит нейронные сети, – оказалась решающей. Согласно корпоративному фольклору, этот счастливый случай привел к созданию в Google лаборатории искусственного интеллекта. Ын, однако, вспоминал это по-другому. С первых дней работы в компании он знал, что его проект зависит от степени заинтересованности Джеффа Дина. Его постоянной заботой было сначала затащить Дина на борт, а потом удержать его там. Однако он не знал тогда, что у Дина была своя история отношений с нейронными сетями. Дин был почти на десять лет старше Ына, и он исследовал эту идею, еще будучи студентом Университета Миннесоты в начале 1990-х, в эпоху первого ренессанса коннекционистских исследований. Для своей дипломной работы он обучил нейронную сеть на компьютере Сaesar с шестьюдесятью четырьмя процессорами, который на то время казался невероятно мощным, но мощность которого на самом деле была слишком мала, чтобы эта технология могла привести к какому-нибудь полезному результату. «Мне казалось, что, если выполнять вычисления параллельно на шестидесяти четырех процессорах, это позволит добиться каких-то интересных результатов, – говорит он. – Но я был слишком наивен». Вычислительной мощности требовалось в миллион, а не в шестьдесят раз больше. Поэтому, когда Ын сказал, что работает над нейронными сетями, Дин хорошо понимал, о чем идет речь. Более того, на тот момент в Google эту идею изучали два специалиста, включая нейробиолога по имени Грег Коррадо. «У нас в Google много компьютеров, – сказал он Ыну в своей обычной прямолинейной манере. – Так почему бы нам не попробовать обучать действительно большие нейронные сети?» В конце концов, именно в этом Дин и был выдающимся специалистом: он знал, как объединить вычислительные мощности сотен и даже тысяч машин, чтобы применить их к одной задаче. Той зимой он поставил дополнительный стол в лаборатории Google X и занимался проектом Ына в свои «20 процентов времени» – так в Google называют один день в неделю, когда «гуглеры» традиционно вольны заниматься какими-то побочными проектами. Поначалу проект «Марвин» рассматривался лишь как очередной эксперимент, и Ын, Дин и Коррадо уделяли ему лишь часть своего внимания.
Они создали систему121, которая подражала очень популярному времяпрепровождению начала 2010-х: смотрела на YouTube видеоролики с кошками. Опираясь на мощь122 более шестнадцати тысяч компьютерных чипов, установленных на тысяче компьютеров по всем дата-центрам Google, она анализировала миллионы этих видеозаписей и училась распознавать кошек. Результаты, которые она показывала, далеко уступали в точности лучшим инструментам распознавания образов, которые существовали на то время, но это было большим шагом вперед в шестидесятилетней эволюции нейронных сетей. Ын, Дин и Коррадо опубликовали123 свое исследование следующим летом, и среди специалистов по ИИ эта публикация получила известность как «Статья про кошек». Проект также попал124 на страницы New York Times, где его назвали «моделированием человеческого мозга». Именно так сами исследователи рассматривали свою работу. Дин и нейробиолог Коррадо в конце концов с головой погрузились в проект Ына. Они также привлекли дополнительные научные силы из Стэнфорда и Торонто, и под