Шрифт:
Интервал:
Закладка:
Нельзя сказать, что в первом предложении романа Эмиса есть какие-то изъяны. Оно правильно с точки зрения грамматики. В нем есть определенная философская глубина. Иные критики, пожалуй, найдут в нем литературные достоинства. Но оно не цепляет так, как цепляют первые предложения бестселлеров.
Вот еще несколько примеров удачных первых предложений. Все начинающиеся с них романы стали бестселлерами. В списке есть как традиционным способом опубликованные книги, так и те, что вышли самиздатом, как рассчитанные на массового читателя (так называемое чтиво), так и представители высокой литературы, а также один лауреат Пулитцеровской премии. Сможете ли вы определить, кто где?
Я часто жалею, что я – не британская монета в один фунт, а девушка-африканка.
Секрет в том, как умереть.
Кто не усомнился бы, услышав от собеседника, что он провел все выходные в обществе Бога?
Я родился дважды: сначала как младенец женского пола в странно чистый от смога январский день 1960 года в Детройте, а потом второй раз, в августе 1974, как мальчик-подросток, в отделении неотложной помощи недалеко от Питоски, штат Мичиган.
Белую девушку застрелили первой.
Она лежала на спине, крепко пристегнутая ремнями к узкой койке со стальной рамой[135].
Во время игры Шварц не замечал мальчика.
Я любила Нью-Йорк безумной и страстной любовью, какой удостоилось единственное другое существо в моей жизни[136].
Они все лаконичны, но при этом богаты, не правда ли? Они буквально кричат: «Сейчас начнет разворачиваться сюжет!» Конечно, понятие стиля касается не только первой фразы книги, но именно по ней часто можно понять, насколько хорошо автор контролирует то, что будет дальше, и насколько его стиль привлекателен для читателей.
Когда дело касается компьютерного анализа и сравнения стиля тысяч романов, работа не ограничивается изучением слов в первом предложении. Процесс гораздо сложнее. Наш анализ стиля начинается со сбора нескольких тысяч параметров. Они обычно касаются употребления заурядных слов – таких как of, the, a, and[137], but[138] и т. п. Но кроме этого мы собираем информацию о синтаксисе, длине предложений, пунктуации, частях речи, а также – о наиболее часто встречающихся в книге глаголах, существительных, прилагательных и наречиях. Мы знаем, например, как часто Джон Гришэм использует прилагательные, а также кто больше любит запятые – Даниэла Стил или Донна Тартт. Мы вычисляем относительную частоту употребления определенных слов для каждой книги. Например, мы знаем, что в «Коде да Винчи» Дэн Браун употребляет артикль the семь раз на каждую сотню слов. А Джон Гришэм в «Фирме» – чуть менее шести раз на сотню. Если бы нам дали неподписанную книгу, принадлежащую перу одного из этих двоих, мы могли бы вполне обоснованно предположить, кто ее автор, – на основании того, как часто в ней используется the. В «Дороге» Кормака Маккарти слово and – второе по частоте (после the), а he – третье по частоте, оно встречается чуть меньше четырех раз на сотню слов. А вот местоимение she в «Дороге» почти не используется – всего одно на две тысячи слов. Напротив, в «Зове кукушки» she – седьмое по частоте слово, примерно 1,5 раза на сотню. В романе Энтони Дорра о Второй мировой войне два главных героя – мальчик и девочка, и местоимения his и her[139] имеют абсолютно одинаковую частоту (примерно одно на сотню слов). А вот в романе Норы Робертс «Последняя любовь» her встречается вдвое чаще, чем his. При этом Робертс нечасто использует местоимение второго лица you[140]. Зато Николас Спаркс в «Дневнике памяти» и Адам Джонсон в «Сыне повелителя сирот»[141] демонстрируют свою любовь к этому слову (1,3 упоминания на сотню у Спаркса и 1,4 – у Джонсона). Такие детали могут показаться чересчур мелкими, но они подобны деталям отпечатков пальцев – те тоже мелкие, но от них могут зависеть вопросы жизни и смерти.
Наша модель берет самые элементарные составляющие стиля – даже не камни фундамента, а раствор, скрепляющий эти камни, – и показывает нам, как каждая из них фигурирует (или не фигурирует) в том или ином романе. Эти сырые данные об индивидуальных элементах дают нам базовую информацию о стиле автора – сколько он использует запятых, двоеточий, апострофов и прочих знаков препинания, а также самых простых и распространенных глаголов (таких как did[142] и want[143]), существительных (таких как man[144] и woman[145]), прилагательных и наречий. На этом уровне мы еще не задаемся вопросом, какие предложения более типичны для автора: Peter designated the common garden tool that digs, an instrument of weeding the unwanted[146] – или Peter called a spade a damn useful shovel[147]. Но с помощью стилеметрического анализа мы мгновенно устанавливаем, что в первом предложении слово the встречается два раза, that, of и an – по одному, а во втором два раза встречается артикль a, но нет ни одного из слов the, that, an, of. Все эти артикли, местоимения и предлоги позволяют в два счета понять, какого стиля придерживается автор. Более длинные предложения требуют связующих конструкций – чего-то вроде строительных лесов или подпорок. Узнав, с какой частотой автор употребляет эти и другие служебные слова, мы получаем его стилистическую «подпись». Совокупность всех частот – это стилистические «позывные» автора, они всегда одни и те же, независимо от того, какое имя стоит на рукописи – Роулинг или Гэлбрейт.