Шрифт:
Интервал:
Закладка:
6.3.4.2 Смысл теста Тьюринга
Наблюдая за публичными рассуждениями журналистов и публики о тесте Тьюринга и об успехах современных чат-ботов, хочется обратиться к истинному смыслу этой процедуры, вложенному в неё автором. Тест Тьюринга нужно рассматривать в контексте других его идей и исследований. Одной из важных концепций, созданных Тьюрингом, стала концепция эквивалентности двух машин (также называемая «слабой эквивалентностью» [weak equivalence]): если машина A может эмулировать работу машины B, а машина B может эмулировать работу машины A, то эти машины являются эквивалентными (или, как принято говорить сегодня, тьюринг-эквивалентными). Идея «игры в имитацию» заключается в том, что машина обладает интеллектом в том случае, если она может эмулировать естественный интеллект[2250]. Принципиальная возможность такой эмуляции называется тезисом о симуляции [Simulation thesis], этот тезис является более сильной версией тезиса Чёрча — Тьюринга[2251]. Ввиду этого тест Тьюринга в действительности имеет весьма опосредованное отношение к чат-ботам: естественный язык в нём используется лишь потому, что он является символьной системой, при помощи которой может быть сформулировано условие интеллектуальной задачи. Вообще, при помощи естественного языка можно сформулировать условие любой «эффективно вычислимой» задачи, ведь при помощи естественного языка можно описать формализм машины Тьюринга или лямбда-исчисление Чёрча.
Таким образом, в тесте Тьюринга проверяется не способность интеллектуального агента давать разумные ответы на бытовые вопросы, а его способность решать интеллектуальные задачи: «Какая последняя буква в слове „вечность“?», «Напиши имя лучшего друга крокодила Гены задом наперёд», «Отсортируй вот эти числа по убыванию: 1 1 2 3 5 8 13 21», «Назови синоним слова „воздушный“», «Сочини стишок с рифмой „розы — морозы“», «Реши анаграмму: аалтерк», «Скажи, на какой предмет это похоже: -O-O-» и так далее. На все эти и подобные им вопросы должен уметь отвечать универсальный ИИ, ведь ответы на них сможет дать практически любой человек, заинтересованный в том, чтобы помочь судье понять, кто из участников является человеком, а кто нет.
Надо заметить, что в обычном разговоре мы редко задаём другим (тем более незнакомым) людям подобные вопросы: мешают правила приличия, боязнь ненароком обидеть собеседника либо показаться дураком в его глазах. Эту уязвимость людей в обычном общении могут использовать мошенники, в том числе «высокотехнологичные», применяющие чат-боты в качестве инструментов своего жульничества. В этом случае чат-боты могут успешно выпрашивать у людей деньги (например, на якобы благотворительные цели), персональные данные, CVV- и пин-коды от банковских карточек, обнажённые фото и бог знает что ещё. Такие «успехи» чат-ботов в рассуждениях дилетантов нередко используются в качестве аргументов в пользу мифа о том, что тест Тьюринга уже пройден машинами. Нередко из этого делается вывод о том, что тест Тьюринга устарел, «сломан», что его нужно заменить на какую-либо другую процедуру, дополнить или радикально переформулировать. Нельзя сказать, что изначальные формулировки теста лишены недостатков, однако нередко его «улучшатели» не в полной мере понимают суть идеи Тьюринга: его тест — это не тест на способность обманывать кого-либо, а тест на способность системы ИИ выполнять все задачи, подвластные человеческому разуму.
6.3.4.3 Прогресс диалоговых систем и применяемые подходы
Впрочем, безотносительно теста Тьюринга прогресс в области диалоговых систем в последнее десятилетие весьма впечатляет. Eugene Goostman, как и другие боты из числа победителей и призёров соревнований (Tutor, Mitsuku, Rose, Uberbot, Arckon, Colombina и т. д.), являются удивительными образцами искусства программирования, демонстрирующими как достижения современных технологий, так и незаурядные таланты их создателей. Лучшие системы на сегодняшний день способны в ходе пятиминутного диалога уверенно обвести вокруг пальца как минимум треть неподготовленных судей, что, вне всяких сомнений, является выдающимся результатом.
Разработкой разговорных агентов в нашей стране сегодня занято множество профессиональных коллективов. Благодаря их усилиям на свет появилось большое количество продвинутых платформ и библиотек для разработки систем для автоматизированных коммуникаций. Это и «Алиса» от Яндекса, и DeepPavlov — открытая библиотека для создания диалоговых систем, разработанная лабораторией нейронных систем и глубокого обучения МФТИ, и NLP-платформа Сбербанка, включающая сегодня робота-оператора от дочерней компании банка ООО «АБК», и диалоговые платформы от «Центра речевых технологий», mail.ru, Тинькофф Банка, Dasha.AI и других команд опытных исследователей и разработчиков.
В последние годы мы наблюдаем настоящий бум в области диалоговых систем. Роботы осуществляют всё большее количество голосовых коммуникаций с клиентами компаний, а технологические гиганты уверены в том, что голосовые помощники могут стать новым способом «переизобрести» интернет (предыдущими были поисковые системы и социальные сети, радикально изменившие широко распространённые практики использования ресурсов сети). Чат-бот может быть источником полезной информации, помощником в выполнении какой-нибудь задачи и даже собутыльником. Можно долго рассуждать о причинах нынешнего бума, я назову лишь наиболее, на мой взгляд, важные. Прогресс в области распознавания и синтеза речи позволил диалоговым системам освоить голосовой канал коммуникаций, и в то же время, благодаря развитию мессенджеров и социальных сетей значительно выросла популярность текстового канала. Люди стали активно использовать мобильные устройства коммуникации, что вкупе с ростом доступности доступа в интернет привело к тому, что сегодня они проводят онлайн гораздо больше времени, чем раньше. Всё это привело к росту числа онлайн-сервисов, начиная от площадок для онлайн-торговли, сервисов бронирования авиабилетов и гостиниц и заканчивая платформами госуслуг и дистанционной медицины. Развитие этих сервисов повысило спрос на соответствующие технологии автоматизации, в том числе автоматизации диалоговых взаимодействий. Не последнюю роль здесь сыграл и прогресс в области обработки естественного языка, позволивший разрабатывать системы, создание которых в прошлом было или просто невозможно, или связано с неприемлемыми издержками. При этом некоторые методы, применяемые в наши дни создателями диалоговых систем, были изобретены ещё во времена Элизы и Перри. Поэтому типичный чат-бот в наши дни чем-то напоминает монстра Франкенштейна — причудливый конгломерат коннекционистских и традиционных (GOFAI) методов, примотанных друг к другу программными аналогами синей изоленты. Он способен худо-бедно решать стоящие перед ним задачи, но не отличается особым изяществом архитектуры и грациозностью действий. Давайте разберём некоторые подходы и методы, которые применяются при создании диалоговых систем, и попробуем разобраться, какие принципиальные инновации появились в этой области в последние годы. В зависимости от способа получения реплик все диалоговые модели теоретически подразделяются на генеративные [generative] и основанные