Шрифт:
Интервал:
Закладка:
Что вполне логично. В 1960-е, когда на военных обрушилась лавина данных и им потребовались новые инструменты для ее обработки и анализа, ARPA было поручено найти решение этой проблемы. Три десятилетия спустя инициатива по созданию электронных библиотек превратилась в дополнение того же проекта, продиктованного сходными нуждами. И, как в прежние времена, DARPA сыграло в этом свою роль{381}. В 1994 году, всего за год до прибытия Пейджа в Стэнфорд, профинансированная DARPA библиотечная инициатива в Университете Карнеги – Меллона принесла видимый результат в форме Lycos, поискового сервиса, названного по научному наименованию семейства пауков-волков Lycosidae{382}.
Поисковые интересы Ларри Пейджа идеально совпадали с задачами инициативы, и его исследование проводилось под ее покровительством{383}. Когда в 1998 году он опубликовал свою первую исследовательскую работу, на ней была знакомая отметка: «Профинансировано DARPA». Агентство, создавшее интернет, осталось центральным игроком.
Ларри Пейдж познакомился с Сергеем Брином в первый день пребывания в Стэнфорде на вводном занятии для студентов-аспирантов. Они были одновременно и в чем-то схожи, и диаметрально противоположны. Они быстро сдружились.
Пейдж был замкнутый и тихий; некоторые думали, что он, возможно, несколько аутичен. Говорил он слегка шепеляво, что некоторые принимали за восточноевропейский акцент{384}. Брин был совершенно другой: общительный, разговорчивый, увлекался спортом. Однокурсники Брина вспоминают, что он постоянно раскатывал на роликах по холлам университета и часто заглядывал к преподавателям, чтобы с ними поболтать. В отличие от Пейджа, Брин действительно был родом из Восточной Европы. Единственным мостом между двумя этими людьми было экспериментирование с компьютерами и интернетом, которым они увлекались с раннего детства.
Семья Сергея Брина эмигрировала из Москвы в США в 1970-е годы и успешно интегрировалась в научно-техническое сообщество. Его мать Евгения была ученым в НАСА, а отец Михаил – штатным преподавателем математики в Мэрилендском университете.
Брин с детства проявлял незаурядные математические способности. В девять он открыл для себя интернет и стал зависать в чатах и в многопользовательских «подземельях»[25],{385}. Он часы напролет проводил в мире новых коммуникационных технологий, пока не разочаровался в нем, осознав, что там было полно людей вроде него – «десятилетних мальчишек, пытающихся поговорить про секс»{386}.
Брин окончил школу в 1990 году, на год быстрее, и поступил в Мэрилендский университет сразу на две специальности: математику и информатику. В 1993 году он с отличием выпустился и перебрался в Пало-Альто для продолжения обучения в Стэнфорде на аспирантском гранте, предоставленном Национальным научным фондом{387}. В Стэнфорде он увлекся темой извлечения данных – созданием компьютерных алгоритмов, которые могли бы предсказывать поступки людей на основании их прошлых действий. Что они хотят купить? Какие фильмы им понравятся?{388} Он даже создал студенческую группу под названием MIDAS (Mining Data at Stanford[26]). Впоследствии извлечение поведенческих данных действительно оказалось золотоносным для Google, как прикосновение Мидаса. Но тогда до этого было еще далеко. Когда Брину наскучила узкая тема его исследования, он решил создать новый проект со своим закадычным другом Ларри Пейджем. «Я общался с многими исследовательскими группами, но этот проект был особенно увлекательным, потому что он был связан с вебом, воплощением всех знаний человечества, и поскольку мне нравился Ларри», – вспоминал Брин в одном из интервью{389}.
Главная проблема поиска заключалась в релевантности информации. Одни веб-страницы были важнее и авторитетнее других, однако первые поисковики не видели между ними разницы. Пейдж понимал, что было необходимо встроить в результаты поиска рейтинговую систему. Простая, но мощная идея, пришедшая из академического мира, где важность научной работы измерялась количеством ее цитирований в других работах. Считалось, что процитированная тысячу раз статья важнее процитированной десять раз. Гиперссылочная структура интернета, где каждая веб-страница была связана ссылками с другими страницами, фактически делала его гигантской машиной цитирования. Это было открытие Пейджа. Он назвал свой экспериментальный проект PageRank и вместе с Брином приступил к его реализации.
Сначала они создали бота, который должен был «шерстить» интернет, собирая данные и сохраняя их на стэнфордском сервере. Затем они усовершенствовали алгоритм PageRank для получения релевантных результатов поиска. Так как разные ссылки обладали разной ценностью (ссылка на страницу газеты вроде New York Times была важнее ссылки на чей-то сайт-визитку), они скорректировали свои расчеты таким образом, чтобы страницы обсчитывались сразу и по количеству ссылок на них, и по «весу» этих ссылок. В итоге учитывались сумма всех ссылок и количественные выражения их ценности. Когда значения первых нескольких страниц попадали в алгоритм PageRank, новые данные ранжирования рекурсивно применялись ко всей сети. «Мы превратили весь веб в большое уравнение с несколькими сотнями миллионов переменных, которые представляли собой рейтинговые значения для всех страниц», – объяснял Брин после запуска Google{390}. Это была динамичная математическая модель интернета. Если менялось одно значение, то происходил перерасчет по всей сети{391}.
Они вложили алгоритм в экспериментальный поисковый движок, который назвали BackRub, и запустили его для стэнфордской внутренней сети. Логотип BackRub был жутковатый: черно-белая фотография ладони, приделанной к волосатой руке, которая чесала голую спину. Но никому до этого не было дела. Когда о поисковике прослышали студенты, то они стали активно им пользоваться и были поражены. Студенческий проект оказался лучше, чем любой имевшийся на тот момент коммерческий поисковик вроде Excite или AltaVista. Ведущие поисковые компании стоили миллиарды, но не понимали, чем занимались. «Они видели только текст, но не учитывали ничего, кроме него», – говорил Пейдж{392}.
Поисковый движок, который друзья быстро переименовали в Google, стал таким популярным, что превысил пропускную способность стэнфордской сети. Брин и Пейдж осознали, что они сделали нечто особенное. Google был больше, чем просто исследовательский проект.
Даже на этой начальной стадии они понимали, что поисковый алгоритм Google – не просто абстрактная математика. Он каталогизировал и анализировал веб-страницы, считывал их содержимое, фиксировал исходящие ссылки, ранжировал страницы по важности и релевантности. Создатели Google видели, что так как страницы писались и создавались людьми, то их система индексирования главным образом зависела от своего рода постоянной слежки за интернетом. «Процесс может казаться абсолютно автоматическим, но не стоит забывать о человеческом факторе, который влияет на конечный продукт: на свете миллионы людей, которые создают дизайн своих веб-страниц, выбирают, на кого поставить ссылку