Шрифт:
Интервал:
Закладка:
Как мы видим, информация о покупках не помогла бы при определении сходства продуктов, однако данные о словах, напротив, могут быть весьма полезны. Ежедневно миллиарды людей пишут триллионы слов в интернете. Это и новостные статьи, и обзоры покупок, и посты в соцсетях. Отдельно взятая статья, рецензия или отзыв могут быть не так полезны, однако вместе они дают всестороннюю информацию о взаимосвязи различных идей и концепций.
Рассмотрим предложение: «Врач вошел в операционную и надел перчатки». На первый взгляд это предложение очень простое, но для программы, устанавливающей взаимосвязь между словами, оно весьма информативно. Оно говорит, что объект «врач» входит в помещение, которое называется «операционной», и надевает предмет под названием «перчатки».
Используя метод, который применялся для анализа песен (просмотр множества предложений, в которых употребляются одинаковые слова), мы получаем представление о том, как связаны разные слова, идеи и концепции. «Доктора» с некоей периодичностью входят и выходят из «операционной», используют «перчатки» или, например, «ведут прием пациентов». Это дает приблизительное представление о том, чем занимается «врач».
Так учат детей. Если вы посмотрите на малыша пяти месяцев, ткнете куда-то в середину своего лица и произнесете: «Нос», ребенок не поймет, что вы хотите сказать. Для него слово «нос» ничем не отличается от слова «демократия» или «истеблишмент». Однако если постоянно произносить это слово, указывая на свой нос или на нос малыша, рано или поздно ребенок его усвоит.
По тому же принципу учатся машины. Загрузив в себя все статьи из «Википедии» или сообщения из Google News, компьютер может начать понимать значения разных слов и улавливать связь между ними. Если со словом «собака» часто употребляется прилагательное, например «дружелюбный», то читатели (и машины тоже) смогут связать эти два слова и в будущем легче их находить. О «кошке» чаще говорят как о животном «независимом», что тоже позволяет связать два этих слова.
Для образования смысловых связей совсем необязательно, чтобы слова употреблялись вместе. Фразы «собаки – животные» и «животные дружелюбны» уже позволят программе соединить понятия «собака» и «дружелюбие», даже при отсутствии точного указания, что собаки дружелюбны.
Британский лингвист Дж. Р. Ферт сказал: «Смысл слова можно понять из его окружения». Иными словами, можно больше узнать о понятии, изучив контекст – слова, которые стоят рядом.
По тому же принципу логично предположить, что люди, которые много времени проводят вместе, вероятно, станут друзьями. Слова, употребляемые в одном предложении, несомненно, так или иначе связаны между собой. На этом основывается метод, который называется векторным представлением слов – сопоставлением слов и представлением их в определенном окружении.
Когда люди переезжают в новый дом или квартиру и раскладывают вещи, то, как правило, при выборе места для них основываются на том, как пользуются этими вещами. Например, ложки кладут в ящик с приборами, овощи – в холодильник, чистящие средства ставят под раковину. Векторное представление слов поступает так же со словами. Чем сильнее слова связаны друг с другом, тем ближе они расположены. Слова «собака» и «кошка» расположены довольно близко друг к другу, потому что означают животных, причем домашних. Основываясь на ассоциациях, «собака» ближе к понятию «дружелюбный», а «кошка» – к «независимый».
Этот метод использует не два и не три измерения, а сотни.
Родственные слова находятся близко друг к другу, и расстояние между ними можно измерить. «Грейпфрут», например, ближе к «апельсин», чем к «киви», следовательно, у них больше сходства. Неудивительно, что фрукты будут далеки от слова «тигр».
ПРАВИЛЬНОЕ УСКОРЕНИЕ
Выстраивание слов – увлекательное занятие. Как мы говорили ранее, при помощи преобразования текста в векторную форму можно изучить любую тему – от гендерных предубеждений и расизма до эволюции мышления.
Чтобы выяснить, способствует ли повышению популярности книги или фильма быстрое развитие сюжета, мы с коллегами применили тот же метод уже не к словам, а к предложениям и даже абзацам. Две части любой книги или фильма могут обладать схожими чертами так же, как два слова.
Чтобы понять, как это работает, вспомним уроки географии, которую вы наверняка изучали в старших классах школы. В учебнике есть параграфы, рассказывающие о земной коре, землетрясениях, погоде и даже Солнечной системе.
Возьмем для рассмотрения первый абзац любого параграфа – скажем, о землетрясениях. Мы обнаружим, что он тесно связан со следующим абзацем. Параграф может начинаться с того, что дается определение землетрясению, а затем говорится о том, какие процессы его вызывают. В обоих случаях используются одинаковые слова, фразы и понятия (например, «землетрясение», «разлом» и «тектоника плит»). Каждый последующий абзац связан по смыслу с предыдущим, но чем дальше расположены друг от друга абзацы или параграфы, тем меньше они похожи. Например, в параграфе, рассказывающем о землетрясениях, используются понятия, отличные от тех, что встречаются в параграфе о Солнечной системе.
Этот метод применим к книгам, фильмам и любому тексту в целом. Сцена, где показана свадьба, вероятно, будет очень похожа на любую другую сцену со свадьбой: те же действующие лица, похожая обстановка, аналогичные действия людей. При этом сцена со свадьбой будет меньше похожа на сцену вторжения инопланетян или на сцену, где показаны погружение с аквалангом или ремонт автомобиля в сервисе. Действующие лица могут оставаться прежними, однако обстановка, предметы и занятия людей будут иными.
Важно отметить, что каждая последующая глава книги или сцена фильма, как правило, связана с предыдущей, однако степень близости между ними может значительно отличаться. Измеряя расстояние, указывающее на связь объектов в произведении, мы можем определить, насколько быстро развивается сюжет[85]. Если в начальной главе говорилось о свадьбе, а в следующей уже о вторжении инопланетян, значит, действие происходит быстро по сравнению с повествованием, где и в первой, и во второй частях ведется рассказ о свадьбе.
Первый автомобиль, несомненно, движется быстрее второго, если преодолевает равное для обоих расстояние за меньший отрезок времени. Если в определенном произведении части или сцены меньше связаны между собой, значит, сюжет развивается быстро, если не стремительно.
Для изучения взаимосвязи между скоростью развития сюжета и успехом у аудитории мы провели анализ тысяч книг, фильмов и сериалов – от классики вроде Чарльза Диккенса и Джека Керуака до более современных книг, таких как Hi-Fi Ника Хорнби и «В тихой гавани» Даниэлы Стил, а также фильмов «Звездные войны», «Криминальное чтиво» и «В лучах славы», ситкома «Я люблю Люси» и мультипликационного сериала «Южный Парк».
Мы выяснили, что в целом скорость развития сюжета в этих произведениях довольно высока. Такие книги, фильмы и сериалы нравятся публике больше, чем те, в которых действие развивается более размеренно. Стремительное развитие сюжета делает произведение увлекательным по тому же принципу, по которому песни с нестандартными текстами становятся хитами. Вместо медленного шествия рука об руку с героями люди предпочитают молниеносно перемещаться между разными по смыслу темами, сценами и главами: это вызывает интерес.
Мы обратили внимание на то, что в некоторых моментах произведения сюжет развивается быстро, в других же словно замирает[86]. В самом начале книги или фильма холст, на котором будет развиваться действо, пуст. Зритель или читатель не знает, какие ему встретятся персонажи, какие это будут временной период и место действия. Начало произведения закладывает основу, являет собой отправную точку для последующего повествования. И важно, чтобы в начале события развивались медленно. Аудитории нужно время на то, чтобы привыкнуть к персонажам и прочему, поэтому большая скорость может сбивать с толку. Например, если в парной эстафетной гонке участник под номером два бежит слишком быстро, то его напарник может его не догнать и потерять шанс вовремя передать эстафетную палочку. То же самое происходит и с сюжетом: если он с самого начала берет быстрый темп, аудитория может значительно отстать. Таковы были наши выводы: на начальном этапе быстрое развитие сюжета вредно.
Зрители более благосклонно принимают те произведения, события в которых поначалу развиваются медленно. Вспомним известные народные и детские сказки: в них используется принцип повторения. Например, в сказке «Три поросенка» первый поросенок строит себе дом из соломы, а волк дует и разрушает его. Затем все повторяется со вторым поросенком.
По схожему принципу создаются комедии, комиксы и все остальные смешные