Шрифт:
Интервал:
Закладка:
1.3.2.5. Трюк с подменой технологии
Благовидный предлог для приостановки целомудренного навигационного сервиса оказался под рукой. Им стал тот самый недостаток коллаборативной фильтрации, о котором уже упоминалось: необходимость сбора клиентских предпочтений. Для продуктивной работы требуется приличная база клиентских оценок – минимум сотни тысяч. До того как критическая масса набрана, люди не мотивированы выражать свое мнение, поскольку система не способна вознаградить их усилия. Это так называемая проблема холодного старта. Кто-то первым должен потрудиться во имя остальных – это классическая ситуация производства общественного блага со всеми ее сложностями. Для разогрева на старте можно ничего не спрашивать у клиентов, а попытаться вычислить их предпочтения из потребительских действий (кстати, совершаемых не обязательно в рамках рекомендательной системы)[137]. Этой дорогой и двинулся бизнес, вскоре обнаружив, что можно вообще обойтись без сбора прямых и явных (сознательно выраженных) клиентских предпочтений[138]. Косвенными источниками оценок могут служить, например, прошлые покупки или время просмотра конкретной веб-страницы, или последовательность кликов по ссылкам в сети. В. Коуэн и В. Фэн показали, как можно отслеживать музыкальные предпочтения путем анализа логов (хронологической записи событий), статистики скачиваний и прочей технической информации[139]. По названию файла можно установить исполнителя или композитора, а по IP-адресам – потребителей.
Тот же принцип применяется в интернет-магазине Amazon: каждая книга здесь сопровождается списком литературы, приобретенной покупателями данной книги[140]. Считается, что фактом покупки люди выражают свою оценку. Хотя купленное и понравившееся – это, очевидно, не одно и то же, но этой разницей Amazon считает возможным пренебречь. Несмотря на то что качество прогнозов, выведенных из косвенных данных, ниже, чем из прямых потребительских оценок, бизнес сделал ставку именно на них. За этим проглядывает желание не просто избавить покупателей от лишних хлопот, но и дозировать их компетентность. (Это тот же мотив, который привел дигитальные отрасли культуры к единообразию цен.) Опции, облегчающие выбор, привлекают клиентов, способствуя увеличению продаж, но они же уточняют выбор, что ведет к снижению продаж. Предоставляя услугу по навигации, бизнес заинтересован в таком ее виде, который не вредит сбыту продукции разного достоинства. То есть он выбирает оптимальный для себя вариант, но это не значит, что это лучший вариант с точки зрения покупателя. Если бы навигационный сервис Amazon был платным и доходы от него были бы сопоставимы с продажей книг, тогда резонно было бы ожидать более высокого качества. Дареному же коню в зубы не смотрят. Предоставили какую-то навигацию – и на том спасибо. Вообще, экспертиза, соединенная с продажами, потенциально содержит возможность двурушничества, и полагаться на нее если и можно, то с большой осмотрительностью.
1.3.2.6. Кто кого фильтрует?
По мере того как число участников коллаборативной фильтрации растет, нарастают проблемы обработки данных. При нескольких миллионах пользователей ограничения скорости операций становятся ощутимыми. Поэтому, когда рекомендательный сервис используют в качестве придатка к торговым системам, фильтрацию по типу «потребитель-потребитель» заменяют цепочкой «объект-объект» (см. рисунок). Этот принцип экономичнее, в частности из-за отсутствия необходимости часто пересчитывать взаимосвязи между клиентами[141]. В этот момент и закладываются предпосылки для незаметной переориентации метода с нужд потребителей на интересы продавцов.
В основе пообъектной фильтрации – фиксация всех оценок, выставленных пользователями системы различным объектам (это могут быть товары, услуги, учреждения и т. д.), и анализ сходства между объектами, что не совсем то же самое, что сходство между людьми. Например, берется конкретный продукт – книга – и выявляются все прочие книги, получившие от различных потребителей сходную оценку. Хотя с точки зрения математики подсчеты «объект-объект» вроде идентичны данным, полученным из оценок потребителей, но во втором случае отбираются продукты, нужные людям, а в первом – люди, «нужные» для продвижения продуктов. В объектной фильтрации сходство между товарами устанавливается по профилю оценок потребителей, а в «человеческой» версии – по ряду персонально выделенных и значимых параметров. Разница именно в том, что в коллаборативной фильтрации с непосредственным участием потребителей те сами расставляют акценты, а пообъектная схема обходится без этого. Методы были бы идентичны, если бы в поклиентской версии фильтрации учитывались все оценки всех покупок, совершаемых потребителями.
Пренебрегать прямо высказанными оценками – это все равно что судить о совпадении вкусов людей по их знакомству с блокбастерами. К тому же очевидно, что факт потребления чего-либо далеко не всегда равнозначен удовлетворению. Существует зазор между интересом к продукту и его итоговой оценкой. Неспроста модераторы Ringo не ограничивались часто ранжируемыми артистами, а оставляли место для индивидуальных предпочтений. Расхождение между оплатой и удовлетворением особенно существенно тогда, когда нет повторного потребления, и накопления информации (позитивной или негативной) от предыдущих покупок не происходит. Именно поэтому культурная продукция, потребляемая однократно, оказывается в числе наиболее проблемных случаев для пообъектной фильтрации. Здесь между интересом, ожиданиями и конечными впечатлениями может пролегать пропасть. В предметной сфере ситуация менее острая.
В потребительской версии люди сигнализируют о своих итоговых эмоциях и впечатлениях, а в пообъектной – товары указывают на свою способность притягивать внимание людей, что, очевидно, заслуга не только их качества, но еще и рекламы и цены[142]. Таким образом, люди дают экспертную оценку товаров с большей пользой для себя. В особенности если учитывать, что их вовлеченность в процесс сама по себе позитивна. В областях, где люди потребляют приблизительно одинаковый ассортимент, например одни и те же автомобили или стиральные порошки, совпадение списка покупок не выявляет различий во вкусе. Другое дело, что оно указывает на схожесть статусов, и в этом смысле пообъектная фильтрация оказывается информативной. В то же время очевидно, что она скорее подогревает стремление к подражанию, чем к отличиям, и это на руку бизнесу.