Шрифт:
Интервал:
Закладка:
Оуад потратил изрядное количество времени на организацию и проведение своего эксперимента. Ему пришлось написать собственный код для загрузки данных и вручную произвести поиск по базе данных. Однако то, что Оуад сделал вручную, можно более эффективно выполнить автоматически, используя алгоритмы интеллектуального анализа данных, которые позволяют извлекать информацию одновременно из многих различных сайтов. Одна из основных характеристик компьютерной сети – взаимосвязь разнообразных хранилищ информации. «Открытость» баз данных представляет собой основной источник мощи Всемирного компьютера. Однако это также позволяет легко обнаружить скрытые взаимосвязи между отдельными фрагментами данных. Проанализировав эти отношения, можно обнаружить на удивление обширный кладезь конфиденциальной информации о веб-пользователях.
В 2006 году на конференции ученых в области компьютерных наук, состоявшейся в Сиэтле на той же неделе, когда в прессе появилась информация о личности Тельмы Арнольд, пять ученых из Миннесотского университета представили документ под названием «Вы есть то, что вы говорите: угрозы конфиденциальности, связанные с публичными высказываниями» (You Are What You Say: Privacy Risks of Public Mentions). Они описали, как можно использовать программы для объединения онлайновых баз данных. Находя пересекающиеся данные, эти программы создают подробные личные профили людей, даже когда те предоставляют информацию анонимно. Такое программное обеспечение базируется на простом и очевидном принципе: люди, как правило, выражают свои интересы и мнения на разных сайтах в интернете. Они могут, например, купить альбом в музыкальном магазине iTunes, включить этот альбом в свой плейлист на сервисе Last.fm, оценить его на сайте Rate Your Music и упомянуть о нем в комментарии в музыкальном блоге. Или же отредактировать статью в энциклопедии Wikipedia, посвященную их любимому актеру, написать рецензию на его новую биографию на сайте Amazon, стать его «другом» в социальной сети MySpace и отметить его фотографии на сервисе Flickr. Сложные алгоритмы определяют такие соответствия и используют их для очень точного определения конкретных личностей, как это сделали исследователи из Миннесоты. Проанализировав всего две базы данных: одну с сайта, содержащего рейтинги фильмов, и вторую из форума, посвященного обсуждению фильмов, – они обнаружили, что их алгоритм смог успешно идентифицировать 60 % из тех, кто упомянул восемь или более фильмов.
«В современном богатом данными сетевом мире, – объясняют они в своей статье, – люди рассказывают в интернете о многих аспектах своей жизни. Обычно эти аспекты рассредоточены: вы можете писать вольные рецензии на фильмы в своем блоге под псевдонимом и в то же время участвовать в обсуждениях на форуме или сайте, посвященном медицинской этике, под своим реальным именем. И все-таки эти отдельные личности могут быть связаны» с помощью алгоритмов интеллектуального анализа данных. Такой автоматизированный процесс идентификации, утверждают они, «создает для пользователей серьезные угрозы конфиденциальности». Даже если люди нигде не проявляют свои настоящие личности, их имена, как правило, легко выяснить, если они выдают очень небольшое количество идентифицирующих характеристик. Авторы отмечают, что имя и адрес подавляющего большинства американцев могут быть определены, если известны лишь их почтовый индекс, день рождения и пол – три фрагмента информации, которые люди регулярно предоставляют при регистрации на сайте.
«У вас больше нет частной жизни, – заметил еще в 1999 году Скотт Макнили, бывший исполнительный директор компании Sun Microsystems. – Смиритесь с этим». Бытует мысль о том, что за удобство интернета приходится платить потерей конфиденциальности, и в этом есть доля правды. Однако мало кто из нас осознаёт, в какой степени мы раскрываем подробности нашей личности и жизни, равно как и то, что эти детали могут быть извлечены из журналов поиска или других баз данных и связаны с нами. И, несмотря на наше отношение к потере конфиденциальности, это далеко не единственная и даже не самая внушительная угроза современного интернета. Математики и программисты продолжают совершенствовать алгоритмы анализа данных и находят новые способы предсказания реакций людей на информацию или другие стимулы, предоставляемые онлайн. Они учатся не только определять нашу личность, но и манипулировать нами, и их открытия в настоящее время применяются на практике компаниями и правительствами, не говоря уже о мошенниках.
Вполне естественно воспринимать интернет как технологию эмансипации. Он дает нам беспрецедентную свободу самовыражения, обмена идеями и увлечениями, поиска и общения с родственными душами и нахождения информации практически на любую тему, которую только можно себе представить. Для многих людей выход в интернет представляет собой переход к новому, радикально иному виду демократического государства, освобожденного от физических и социальных ограничений, которыми характеризуется реальный мир. То, что Всемирная паутина «расширяет возможности» каждого человека, признают даже те, кто сожалеет о ее коммерциализации или осуждает грубость большей части ее содержимого. В начале 2006 года редакторы интернет-журнала Cato Unbound Института Катона опубликовали специальный выпуск о состоянии Сети. Они сообщили, что «провидцы», работавшие над изданием, казалось, были «единодушны во мнении, что интернет в будущем сохранит за собой роль освободительной силы». В июле 2007 года в своем эссе ученый Клэй Ширки написал: «Интернет производит данные, но его продукт – свобода, много-много свободы». Дэвид Вайнбергер в своей книге «Неплотно соединенные маленькие части» (Small Pieces Loosely Joined, 2002) простыми словами подытожил миф об освободительной силе интернета: «Всемирная паутина – это мир, который мы создали друг для друга».
Это волнующая мысль, но, как и большинство мифов, в лучшем случае полуправда, а в худшем – фантазия. Компьютерные системы в целом и интернет в частности отдают огромную власть в руки отдельных людей, но еще бо́льшую власть они дают компаниям, правительствам и другим учреждениям, чей бизнес заключается в контроле над людьми. Компьютерные системы по своей сути не технологии эмансипации, а технологии управления. Они разработаны как инструменты мониторинга и воздействия на поведение человека для контроля над тем, что и как делают люди. Чем больше времени мы проводим в интернете, заполняя базы данных подробной информацией о нашей жизни и желаниях, тем проще программному обеспечению обнаруживать и использовать модели нашего поведения. Люди или организации смогут понять, чего мы хотим, что нами движет и как мы реагируем на различные стимулы. Клише, которое в этом случае может оказаться правдой, поможет им узнать о нас больше, чем мы знаем о самих себе.
Да, Всемирный компьютер дает нам новые возможности и инструменты для самовыражения и самореализации, но он также дает другим людям беспрецедентную способность влиять на то, как мы думаем и что мы делаем, чтобы направить наше внимание и действия на достижение их целей. В конечном итоге последствия применения технологии для общества и отдельных людей будут в значительной степени определяться тем, как разрешится конфликт двумя сторонами ее природы – освобождением и контролем.
Все живые системы от амеб до государств поддерживают себя за счет переработки вещества, энергии и информации. Они берут материалы из окружающей среды, используют энергию для превращения этих материалов в различные полезные вещества и избавляются от отходов. Это непрерывное превращение сырья в продукт контролируется путем сбора информации, ее интерпретации и манипуляции ею. Процесс контроля также имеет два направления. Он включает в себя измерение – сравнение текущего и требуемого состояний системы и двустороннюю связь – передачу инструкций и сбор сведений о результатах. Обработка информации для целей управления может привести к выбросу гормона в кровь, увеличению производственных мощностей завода или к запуску ракеты с военного корабля, однако в любой живой системе она работает одним и тем же образом.