Шрифт:
Интервал:
Закладка:
Официально Google был зарегистрирован 7 сентября 1998 г. Он использовал алгоритм своих основателей – PageRank (остроумная игра слов с использованием фамилии Ларри Пейджа, который сыграл такую же роль в развитии Интернета, как и Гарфилд в оценке научных публикаций). PageRank определяет актуальность и степень важности сайта путем подсчета количества других сайтов, ссылающихся на него, а также количества ссылок на сами эти сайты. В качестве примера допустим, что на обе страницы – Агентства по охране окружающей среды с информацией о токсичных территориях и фанатов группы Toxic Waste имеется по десять ссылок. Но на страницу агентства ссылаются различные университетские сайты, некоторые газеты и главная страница сенатора, на которые, в свою очередь, ссылаются несколько сотен маленьких сайтов. Общее количество ссылок в этой расширенной сети определяет так называемый Googlejuice сайта агентства, или его место в рейтингах. В этом отношении его сайт будет существенно опережать сайт фанатов группы, на который наверняка ссылались ему же подобные безвестные сайты. PageRank включает в себя и другие переменные величины, которых, если судить по работе Джона Баттеля «Поиск: как Google и его конкуренты переписали правила бизнеса преобразовали нашу культуру» (The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture75), насчитывается около двухсот, Но оценка значимости ссылок остается главным компонентом. Поисковая функция Google оказалась настолько эффективной при определении релевантности (а это обязательное условие для хорошей поисковой системы), что сайт достаточно быстро стал доминирующим игроком в индустрии веб-поиска.
Google продемонстрировал, что индивидуальные решения представителей широких масс, агрегированные должным образом, способны организовать неуправляемый другим путем поток информации. Сила принятия «толпой» коллективных решений выражается в форме ссылок, которые Пейдж и Брин в своей первичной научной работе охарактеризовали как «избирательные голоса». Полагаясь в процессе классификации и распределения контента в Интернете на несогласованные действия миллионов людей, а не на экспертов, Google практически в одиночку отменил веками наработанный здравый смысл.
Вся прелесть поисковой системы Google заключается в том, что она не требует никаких дополнительных усилий со стороны пользователей. Для «толпы» естественно выражать свое мнение. При этом ее коллективные действия уже сами по себе представляют собой систему знаний. Google не требует от людей прочитать и проанализировать все 15 миллиардов веб-страниц. «Толпа» делает это по собственному желанию.
Несмотря на то что PageRank является, возможно, наиболее распространенной системой использования коллективных суждений «толпы» в качестве организационного аппарата, это далеко не единственное воплощение этой идеи. И Amazon, и Netflix используют информацию, генерируемую «толпой», для предоставления рекомендаций по книгам и фильмам для своих заказчиков. Для этого явления есть даже свой термин – «совместная фильтрация», хотя сам этот процесс совсем не нов. «По своей сути “совместная фильтрация” являет собой любой механизм, посредством которого участники сообщества взаимодействуют с целью определения, что есть хорошо, а что – плохо», – пишут авторы книги «От “мышки” к «“мышке”»: маркетинговая мощь совместной фильтрации» (Word of Mouse: The Marketing Power of Collaborative Filtering76). Или более конкретно, что имеет значение для человека, а что нет. Компьютеры просто позволяют выполнять это задание, оперируя наибольшим количеством информации и подключая к этому процессу большее количество пользователей.
Первый автоматизированный совместный фильтр был разработан в калифорнийской компьютерной лаборатории Xerox PARC, которой принадлежит авторство таких инноваций, как компьютерная «мышь» и лазерный принтер. В начале 1990-х гг. научные сотрудники PARC активно пользовались компьютерной сетью Usenet для общения и публикаций, что позволяло им иметь доступ к статьям о последних достижениях в их сфере деятельности. Статьи распространялись с помощью электронной почты, вследствие чего возникала проблема, которая на сегодняшний день беспокоит фактически каждого человека, имеющего электронный адрес, – переполненность электронного почтового ящика. В 1992 г. четверо ученых из PARC разработали систему под названием Tapestry, которая позволяла читателям оставлять комментарии к каждому документу или просто ставить пометку «мне нравится» (“likeit”) или «мне не нравится» (“hateit”). Таким образом, получатели почты могли отфильтровывать тысячи входящих сообщений и статей, задав серверу программу доставки только сообщений, имеющих положительные отзывы77.
Но проект Tapestry носил ограниченный характер, поскольку был доступен только сотрудникам PARC. Несколько лет спустя группа ученых-программистов из Массачусетского технологического института и других университетов запустила проект GroupLens, который также оценивал статьи на Usenet. GroupLens усовершенствовал Tapestry, например, им мог пользоваться любой желающий. Поэтому GroupLens имел доступ к гораздо большему количеству информации, чем Tapestry. Принцип его работы заключался в анализе численных характеристик, определяемых читателями по отношению к различным статьям и распределению единомышленников по группам, исходя из предположения, что если их точка зрения совпадала в прошлом, она совпадет и в будущем. В 1995 г. лаборатория Массачусетского технологического института Media Lab применила данный метод к музыкальным записям, когда она запустила сайт под названием «Полезные онлайн-рекомендации по музыкальным направлениям». Вскоре МТИ обновил сайт Firefly, на котором работала система «музыкальных рекомендаций», и пригласил к участию инвесторов в надежде продать свою технологию фильтрации другим компаниям. В конечном счете сайт Firefly, приобретенный, а впоследствии и закрытый компанией Microsoft, привлек внимание любителей музыки и вдохновил другие сайты, например, популярную интернет-службу Last.FM.
Но своей популяризации «совместные фильтры» обязаны огромному книжному интернет-магазину Amazon. Инновация Аmazon заключалась в проведении взаимосвязи между отдельными предметами, а не пользователями. Другими словами, тщательно отслеживая покупки каждого покупателя, Amazon может использовать огромное количество результативных данных, чтобы провести параллель между «Биографией Ральфа Эллисона» Арнольда Рам-персада и романом Жуно Диаса «Короткая и удивительная жизнь Оскара Уао». Эти книги не имеют ничего общего, между тем люди, которые покупают одну из этих книг, часто покупают и вторую. Почему? Amazon не делает никаких предположений на этот счет, да в общем-то и не нуждается в них. Подчеркнув связь между этими двумя книгами, Amazon просто увеличил их продажи. Система рекомендаций Amazon оказалась настолько эффективной, что подобные методики стали активно применяться и другими сайтами.
И хотя совместные фильтры обычно имеют отношения к системам рекомендаций наподобие той, которую использует Amazon, они предоставляют полезный материал, с помощью которого можно определить, каким образом предпочтения «толпы» используются в разных сферах деятельности. Механизмы коллективного принятия решений подразделяются на две категории: активные и пассивные. Amazon использует пассивный фильтр, данные, являющиеся «побочным продуктом» покупок, осуществляемых клиентами на сайте компании. Пассивная фильтрация нацелена на данные, генерируемые нами в процессе нашей повседневной современной цифровой жизнедеятельности: добавление ссылок к блогам, просмотр видео на YouTube, покупку миски на Williams – Sonoma.com, которые в дальнейшем используются в рациональных целях.