Шрифт:
Интервал:
Закладка:
Добеши совершила свой прорыв в 1986 году, и это сразу же оказало влияние на обработку данных. Особенно широко вейвлеты применяются в сфере медицинской визуализации. При эндоскопических, ультразвуковых, рентгеновских, МРТ- и КТ-исследованиях вейвлеты упрощают обработку и передачу снимков без потери жизненно важных – возможно, даже спасающих жизни – деталей. Но поистине мир, пожалуй, изменило применение вейвлетов в базах данных отпечатков пальцев.
Пионером применения отпечатков пальцев в качестве источника информации для правоохранительных органов был Фрэнсис Гальтон. В 1888 году в письме в журнал Nature он назвал отпечатки пальцев, пожалуй, “самым красивым и характерным из всех внешних признаков” и немного странно описал их как “узоры из тонких линий, которые остаются на полях книг, когда дети хватают их жирными пальцами”[199]. Он вычислил, что вероятность совпадения отпечатков пальцев у разных людей составляет 1 к 64 миллиардам. Скотленд-Ярд не упустил представившийся шанс, основал свою первую картотеку отпечатков пальцев в 1901 году, и уже через год отпечатки пальцев оказались впервые представлены суду в качестве улики. В 1903 году идею подхватили тюрьмы штата Нью-Йорк, где заключенных стали опознавать по отпечаткам пальцев.
Ценность отпечатков пальцев пропорциональна их количеству в вашей картотеке и обратно пропорциональна времени, которое необходимо, чтобы найти их и сравнить между собой. Но чем больше в картотеке записей, тем дольше искать нужную. Сжатие отпечатков пальцев с помощью преобразований Фурье не помогло решить этот парадокс, поскольку при успешном сжатии данных терялось слишком много деталей. Но затем появились вейвлеты, и все изменилось. Сегодня Информационная служба криминальной юстиции ФБР хранит отпечатки пальцев около 150 миллионов человек, применяя для их шифрования вейвлеты Добеши.
Выявление мошенничества
Как мы увидели, у статистиков немало способов отправить человека за решетку – или снять с него бремя вины. Но, пожалуй, самый незаурядный из них – закон Бенфорда. На первый взгляд он кажется совершенно нелепым. Его суть такова: в любой таблице чисел, описывающих естественную активность – включая деятельность человека, – наблюдается особая закономерность: цифра 1 встречается чаще всего, за ней идет 2, потом 3 и так далее до цифры 9, которая встречается лишь в 4,6 % случаев.
Первым это заметил астроном Саймон Ньюком, который изучил то, как его современники в XIX веке пользовались брошюрами с логарифмическими таблицами[200]. Он заметил, что первые страницы брошюры, на которых люди искали числа, начинающиеся с единицы, грязнее остальных. Далее страницы постепенно становились все чище. Таблицы с числами, начинающимися на девятку, почти не использовались. Ньюком пришел к выводу, что большинство его коллег работало с задачами, в которых малые цифры встречались чаще больших. Как выяснилось, астрономия – лишь крошечная часть мира, где наблюдается такая закономерность.
Теперь эта универсальная истина носит имя физика и инженера Фрэнка Бенфорда. В 1889 году, когда Бенфорду было всего шесть лет, произошла катастрофа на дамбе Саут-Форк в его родном городе Джонстауне в Пенсильвании. Потоки воды устремились на Джонстаун со скоростью 40 миль в час, и в результате погибло 2200 человек. Сам Бенфорд сломал руку, но выжил: всю ночь он цеплялся здоровой рукой за корягу, плавающую в воде[201].
После наводнения Джонстаун оказался в бедственном положении, и Бенфорду пришлось в двенадцать лет уйти из школы, но позже он вернулся к учебе и поступил в Мичиганский университет, когда ему исполнилось двадцать три. Получив диплом, он устроился в компанию General Electric и работал в светотехнических лабораториях в Скенектади. Он посвятил им тридцать восемь лет своей жизни – и, несомненно, пересекался с Чарльзом Протеусом Штейнмецом – и вышел на пенсию в июле 1948 года. Пять месяцев спустя Бенфорд умер.
Но имя Бенфорда живет, поскольку в 1938 году он изучил 20 тысяч характеристик естественных феноменов, таких как площадь речных бассейнов, численность населения городов, молекулярный вес различных химических веществ и даже номера домов из адресной книги. Только в 1995 году мы сумели понять, почему наблюдается описанная им закономерность: она становится следствием проявления различных распределений, например нормального и пуассонова, в природе. Закон Бенфорда, который сам Бенфорд изначально назвал “законом аномальных чисел”, описывает, как возникают эти распределения[202]. Мы настолько уверены в существовании соответствующей закономерности, что Налоговое управление США теперь применяет закон Бенфорда, чтобы выявлять мошенничество при аудите счетов компаний. Если вам когда-нибудь захочется подделать что-то, где встречаются цифры, не забудьте учесть закон Бенфорда, иначе статистика точно выведет вас на чистую воду.
Вообще, хотя статистику и можно считать наукой о принятии субъективных решений, это умаляет ее достоинство. Нельзя отрицать, что порой решения принимались неверно, а порой – на заре существования дисциплины – еще и в сомнительных целях. Но они также подарили нам аптечки с лекарствами, действие которых гарантировано, открыли нам доступ к бесчисленным достоверным научным открытиям и предоставили нам инструменты, чтобы анализировать улики в суде и убедительно доносить истину, не говоря уже о чудесных во всех отношениях пинтах пива Guinness.
Поразительно, что в первой главе мы начали с древневавилонских инструментов для сбора налогов, а теперь пришли к американскому инструменту для проверки уплаты налогов. Но если я невольно создал у вас впечатление, что математика нужна лишь в скучных сферах жизни, то следующая (и последняя) глава исправит это недоразумение. Мы совершим путешествие в далекие уголки Солнечной системы, встретимся с жонглирующими роботами, заглянем в мир шпионажа и узнаем о машине, разработанной специально для того, чтобы ничего не делать. Теория информации, может, и не обещает многого, но предлагает немало интересного. А лучше всего то, что она никак не связана с налогами.
Глава 8. Теория информации. История создания современности
Во многих отношениях мы вернулись туда, откуда начали. Хотя название этой главы вам, возможно, ни о чем не говорит, на самом деле она, как и первая, покажет нам, в чем сила чисел в том виде, в котором они перед нами предстают. В ней речь пойдет о числах, сведенных к своей сути, – нулям и единицам, единственным числам, нужным для выражения всех остальных. В ней также будет рассказано, какие ответы в них ищут люди. Двоичная система впустила нас в информационный век компьютерных вычислений, цифровых данных, шифрования и интернета. Но также считается, что с ней связана наша главная надежда наконец постичь космос.