Шрифт:
Интервал:
Закладка:
* * *
Несколько месяцев спустя, стоя за своим высоким письменным столом в Университете Торонто и поглядывая в окно на булыжную мостовую Кингс-Колледж-роуд, Джефф Хинтон открыл письмо от человека, о котором он никогда не слышал. Его звали Уилл Невитт, и он интересовался, может ли Хинтон прислать кого-нибудь из своих аспирантов в штаб-квартиру Google в Северной Калифорнии. Своей работой по распознаванию речи Хинтон и его ученики вызвали настоящую цепную реакцию в IT-индустрии. После запуска новой программы распознавания речи в Microsoft и публикации результатов своих разработок для всеобщего обозрения они повторили свой успех в стенах второго технологического гиганта, IBM. Осенью 2010 года, через девять месяцев после визита в Microsoft, Абдельрахман Мохамед отправился в Научно-исследовательский центр IBM имени Уотсона, величественное здание которого – еще один образец архитектурного творчества Эро Саринена, и тоже с зеркальными окнами, – прячется среди холмов на берегу реки Гудзон в северной части штата Нью-Йорк. А теперь настала очередь Google.
Мохамед все еще работал с IBM, а Джордж Даль был занят другими исследованиями, поэтому Хинтон обратился к аспиранту, который еще практически не привлекался к их работе с распознаванием. Это был Навдип Джейтли, сын индийских иммигрантов, который только недавно включилася в исследования ИИ – до этого он несколько лет занимался вычислительной биологией. Добродушный по характеру, выделявшийся густыми бровями и бритой головой, он работал вместе с Далем в переоборудованном чулане по соседству с кабинетом Хинтона и ждал возможности пройти стажировку на каком-нибудь предприятии. Хинтон пытался найти ему место в канадской компании RIM, выпускавшей смартфоны BlackBerry, но там сказали, что технологии распознавании речи их не интересуют. Компания RIM, чьи кнопочные устройства доминировали на рынке телефонов всего несколькими годами ранее, уже пропустила скачок к смартфонам с сенсорным экраном. Теперь они обрекали себя пропустить и следующий большой рывок в технологиях. Когда Хинтон предложил Джейтли работу в Google, тот поначалу отказался, сказав, что они с женой ждут ребенка, а еще он подал заявку на грин-карту в США, так что на получение визы ему нечего и надеяться. Но уже через несколько дней он передумал и попросил Уилла Невитта, того самого специалиста из Google, который писал Хинтону, приобрести рабочую станцию с необходимыми графическими процессорами.
К тому времени, когда Джейтли прибыл на стажировку в Google, Невитт покинул компанию. Заменившему Невитта инженеру Венсану Вануку, французу по происхождению, по наследству перешли рабочая станция, напичканная мощными видеокартами, с которой он толком не знал, что делать, и канадский стажер, который знал, что с этим делать, но работать в офисе, где все это хозяйство размещалось, не мог, потому что у него не было рабочей визы. Поэтому Ванук позвонил кому-то в небольшой офис Google в Монреале, и для Джейтли там выделили рабочее место. Именно отсюда Джейтли работал в то лето, практически предоставленный сам себе, подключаясь к компьютеру с массивным графическим процессором через интернет. Но сначала он совершил короткую поездку в Северную Калифорнию, чтобы познакомиться с Вануком и запустить рабочую станцию с графическими процессорами. «Никто другой не умел управляться с этой штукой, – говорит Ванук. – Поэтому пришлось ему самому приехать».
Приехав, Джейтли обнаружил рабочую станцию в дальнем углу коридора, за офисом Ванука и остальных членов группы распознавания речи. «Она гудит там, за принтером», – сказал Ванук. Он не хотел, чтобы эта машина стояла в чьем-либо кабинете или вообще близко к работающим людям. Каждый графический процессор был снабжен вентилятором, и эти вентиляторы непрерывно гудели, чтобы уберечь оборудование от перегрева, и он беспокоился, что кто-то, устав от шума, вздумает выключить машину, не понимая, для чего она предназначена. Он поставил рабочую станцию за принтер, чтобы любой, кто услышит жужжание вентиляторов, решил, что этот шум создается принтером. К этой рабочей станции в Google относились с таким же недоумением, как и в Microsoft, но по другим причинам. Создавая свою империю онлайн-сервисов, компания Google организовала всемирную сеть центров обработки данных, охватывающую сотни тысяч компьютеров. Инженеры компании могли мгновенно получить доступ ко всей этой вычислительной мощности с любого персонального компьютера или ноутбука. Именно так они создавали и тестировали новое программное обеспечение – а не с помощью отдельной рабочей станции, задвинутой в угол за принтер. «Здесь принято так: каждый прогоняет свои программы через общие центры обработки данных, – говорит Ванук. – У нас и без того полно компьютеров, так зачем тебе идти и покупать свой собственный, отдельный компьютер?» Загвоздка была в том, что суперкомпьютеры в Google’овских центрах обработки данных не были оснащены графическими процессорами, которые как раз и были нужны Джейтли.
Он хотел сделать то, что Мохамед и Даль сделали в Microsoft и IBM: перестроить существующую систему распознавания речи с использованием нейронной сети. Но он хотел пойти еще дальше. Системы, существовавшие в Microsoft и IBM, отчасти опирались на другие технологии, и Джейтли стремился расширить охват обучения нейронных сетей, надеясь в конечном итоге построить всеобъемлющую систему, которая обучалась бы всему, анализируя произносимые вслух слова. Перед тем как Джейтли покинул Торонто, Даль посоветовал ему никого в Google не слушать, а просто делать свое дело. «Делай в Google то, что хочешь ты, – сказал он, – а не то, что хочет от тебя Google». Поэтому, когда Джейтли встретился в Калифорнии с Вануком и другими представителями Google, он предложил создать еще бóльшую нейронную сеть. Сначала они отказались. Даже обучение небольшой нейронной сети занимало несколько дней, а если бы Джейтли начал обучал сеть на всем объеме данных Google, это могло занять недели. В его распоряжении было только лето. Один из специалистов Google спросил Джейтли, сможет ли он обучить сеть, используя две тысячи часов устного текста, – и тут уже Джейтли отказался. В Торонто Мохамед и Даль обучали сеть в течение трех часов. В Microsoft для обучения использовали информацию в объеме двенадцати часов. Компания Google располагала гораздо большими объемами голосовой информации, поскольку она постоянно получала ее через свои популярнейшие онлайн-сервисы, включая их фирменный голосовой поисковик и YouTube. Но Джейтли