Шрифт:
Интервал:
Закладка:
Попросить о помощи было непросто в другом смысле. Я узнал имена нескольких людей в Apple, которые имели опыт в создании словарей и алгоритмов ввода текста, но они не участвовали в проекте Purple и не было никакого способа посвятить их в большую тайну смартфона.
В те времена сам Стив Джобс принимал решения о том, кого допустить к подписанию соглашения о неразглашении Purple, и не было никакой официальной системы, чтобы затребовать допуск для этих людей.
К лучшему или к худшему, но проект Purple разрабатывался именно так. В итоге я оказался в странной ситуации, когда мог просить о помощи, но только до тех пор, пока не говорю людям, почему задаю именно такие вопросы и что намерен делать с их ответами.
Но это не оказалось таким огромным препятствием, каким могло бы стать. Эксперты по текстам Apple, кажется, совершенно не были обижены моей вынужденной конфиденциальностью в стиле шпионских романов. Они рассказали мне о таких понятиях, как цепи Маркова, условных случайных полях, Байесовских выводах и динамическом программировании.
В конце концов, эти технические разговоры больше вдохновили меня, чем напрямую повлияли на мои алгоритмы. Честно говоря, бо́льшая часть подобной математики была мне недоступна. У меня нет инженерной подготовки — на самом деле, в колледже я не взял ни одного математического курса. Если когда-либо и был какой-то довод в пользу того, чтобы продолжать изучение этого предмета после окончания старшей школы (ведь никто не говорил мне, что математика может мне понадобиться), то это был как раз он. Я пытался прыгнуть выше своей головы.
Тем не менее я не совсем растерялся. Когда Ричард Уильямсон пришел в Apple и помог нам определиться с техническим направлением нашего проекта по созданию браузера, он показал, что можно совершить технический прорыв, временно пропуская проблемы, которые не можешь решить, в пользу тех, для которых у тебя есть решение. Именно это я и сделал.
Я начал с того, что представил свою клавиатуру QWERTY с одной буквой на каждой клавише и сделал предположение о том, каким образом я могу ошибиться с клавишей, на которую нацеливаюсь.
Я предположил, что, если я хочу нажать клавишу G, но палец попадает налево и нажимает на F, с большей вероятностью я имею в виду G или F, а не H. Другими словами, если я попадаю по клавише, в которую не целился, то та, которую я намеревался нажать, скорее всего, будет следующей ближайшей к ней. Я встроил направление этих пропусков в свой алгоритм.
Также я обнаружил, как важно придавать дополнительный вес клавишам, которые подсвечиваются в пользовательском интерфейсе. Во время дерби с клавиатурой мы узнали, что изображение клавиш, появляющееся под вашими пальцами, когда вы их касаетесь, это способ для клавиатуры показать, что она видит. Это именно тот вид обратной связи, который может связать людей и программное обеспечение. Буквы, всплывающие на клавиатуре, создают диалог между устройством и тем, кто находится с другой стороны экрана. Всплывающие буквы выполняют роль дополнительного канала передачи информации, как кивки головой, «угу» и «мммммм», которые мы вставляем во время разговора, когда слушаем других людей. Поток всплывающих букв позволяет человеку узнать, что клавиатура следует за вами, что она «слушает».
Благодаря подсветке видно, что была нажата клавиша F. Если исходить из ее расположения и предположить, что намеревался сделать пользователь, наиболее вероятно, что если он не собирался нажать F, то хотел попасть по G
Информация об отдельных касаниях также важна для отслеживания, поэтому я разработал систему оценки каждого касания, но потребовалось немного времени, чтобы увидеть, что побуквенная оценка дает результаты не лучше, чем обращение к частоте использования. Как я узнал об этом? Я использовал свою программу в жизни. Я делал демоверсии для своих коллег из Purple, и они давали отзывы. Тем не менее второй уровень оценки в алгоритме автоисправления теоретически казался шагом вперед.
Далее я попробовал более комплексный подход к оценке, основанный на целом слове. Вместо того чтобы иметь дело с каждым касанием как с отдельным событием, достойным своей собственной оценки, я сгруппировал все касания вместе. Я представил, как ряд нажатий на клавиши, необходимый, чтобы написать слово, будет выглядеть на рисунке в виде геометрического чертежа или созвездия, отображающего касания клавиш.
Касания клавиш, необходимые для того, чтобы написать слово blog (блог), формируют созвездие, схему нажатий, наложенную на раскладку клавиатуры
Чтобы как-то использовать эту идею, я представил безупречные схемы, которые мог бы создать идеально аккуратный пользователь, если дать ему в руки Wallaby. Я вообразил, как прошу этого идеального пользователя пройти по всему словарю, чтобы впечатать весь набор безошибочных, безупречно центрированных схем. Получившаяся в результате коллекция созвездий состояла бы из точек, расположенных ровно в центре каждой клавиши, каждой буквы для каждого слова в словаре.
У меня в голове автоисправление превратилось в процесс создания схем, возникающих в результате нажатия пользователем на клавиши, и поиска в словаре наиболее близко совпадающей схемы из идеального набора. Другими словами, берется созвездие, полученное от того, кто набирает текст, неизбежно содержащее удары не по центру клавиш и, возможно, какие-то клавиши, нажатые по ошибке. И тогда алгоритмический блок начинает искать созвездие клавиатуры, наиболее похожее на то, которое создал идеальный наборщик. Словарное слово, отвечающее этому образцовому созвездию, и будет тем самым, которое собирался написать пользователь. Ну, по крайней мере, в теории.
Чтобы проверить это на практике, мне нужно было найти способ сравнивать схемы нажатий на клавиши друг с другом. Как и раньше, когда я бегло знакомился с математическими текстами, я не мог понять смысл методов аппроксимации данных или сравнения графиков, которые были похожи на то, что я искал. Я не мог понять формулы и объяснения. Это не укладывалось у меня в голове, и нужно было придумать что-то попроще.
Я представил, насколько мне надо «подвинуть» каждую из точек на рисунке схемы набора, чтобы она выглядела в точности так же, как идеальный образец из словаря. Для каждого сравнения схем я добавил все