Шрифт:
Интервал:
Закладка:
Один из основателей DeepMind Мустафа Сулейман считает, что именно интерактивная парадигма станет фундаментом нового поколения систем ИИ:
Первая волна ИИ касалась классификации. Глубокое обучение показало, что мы можем научить компьютер классифицировать различные типы входных данных: изображения, видео, аудио, язык. Сейчас мы находимся в генеративной волне, когда вы берете входные данные и создаете новые данные.
Третья волна будет интерактивной фазой. Вот почему я уже давно уверен, что диалог — это интерфейс будущего. Знаете, вместо того, чтобы просто нажимать на кнопки и печатать, вы будете разговаривать со своей системой ИИ.
И эти системы будут способны совершать действия. Вы просто дадите системе общую цель высокого уровня, и она будет использовать все имеющиеся у неё инструменты для достижения этой цели. Системы будут разговаривать с другими людьми, разговаривать с другими системами. Это то, что мы собираемся сделать с Pi (перспективной системой от DeepMind. — С. М.).
Это огромный сдвиг в том, на что способны технологии. Это очень, очень глубокий момент в истории технологий, который, я думаю, многие люди недооценивают. Сегодняшние технологии статичны. Грубо говоря, современные системы делают то, что вы им говорите.
Но теперь технологии будут оживлены. У системы будет потенциальная свобода действий, если вы её дадите. То, что мы создаём инструменты, обладающие такой, знаете ли, свободой воли, является настоящим шагом в истории нашего вида[2734].
Современные NLP-модели, основанные на трансформерах, существенно раздвинули границы доступного машинам в области естественного языка, в том числе в отношении творческих задач. При этом возможности машин во многом остаются недоиспользованными — из-за нехватки специалистов и вычислительных мощностей многие идеи пока что повисают в воздухе. Да и те, кто генерирует идеи, не всегда в курсе возможностей, предоставляемых современными моделями. Такая ситуация сложилась в силу быстрого прогресса в области обработки естественного языка. Статьи, рассказы и стихи, написанные машинами, будут всё в большей мере становиться частью нашей обыденной жизни уже в ближайшие десятилетия, и нам ещё предстоит осознать то, как именно это изменит человеческое общество.
При этом важно заметить, что появление эффективных генеративных текстовых моделей вовсе не означает, что машины заменят писателей или поэтов. Куда более реалистичным видится сценарий, в котором такие модели будут использоваться писателями и поэтами для повышения производительности и улучшения качества своего труда. Уже много лет люди, профессионально занимающиеся написанием текстов, используют в работе электронных помощников, и это не только текстовые редакторы и системы проверки орфографии. Например, для авторов, занятых написанием русскоязычных текстов в информационном стиле (например, описаний товаров и услуг для коммерческих сайтов), существует сервис «Главред» (glvrd.ru), который позволяет отследить стилистические огрехи или оценить читаемость текста. Для тех, кто пишет на английском языке, есть онлайн-сервис Grammarly (grammarly.com). Ежедневно к его услугам прибегает 30 млн человек[2735]. Есть и другие инструменты, которыми с удовольствием пользуются писатели. Для тех, кто работает над объёмными литературными произведениями, существуют программы (такие, например, как WriteItNow или WriteWay), помогающие писателю выстраивать сюжетную линию, формировать календарь событий, вести учёт меняющихся во времени отношений между героями.
NLP-модели могут помогать не только писателю или редактору, но и читателю. Мы уже привыкли к таким инструментам, как поиск по текстовым документам или автоперевод, но благодаря достижениям в области обработки естественного языка в последнее десятилетие появились новые полезные возможности. Например, приложение Summly, созданное ещё в начале 2010-х гг., стало одним из первых инструментов для суммаризации (реферирования) текстов: оно позволяло сжать длинный текст до нескольких ключевых предложений. Summly может читать за вас новости, «отжимать из них воду» и создавать короткие дайджесты длиной не более 400 слов. Интересно, что разработал эту систему английский школьник Ник Д’Алойсио. В 2013 г. основанный школьником стартап приобрела компания Yahoo!, и сумма сделки, по слухам, составила 30 млн долларов[2736]. В январе 2014 г. Д’Алойсио объявил о запуске Yahoo News Digest [Дайджест новостей Yahoo] — усовершенствованной версии Summly. Это приложение предоставляло мобильным пользователям сводку важных новостей дня в форме дайджеста, выходящего два раза в день[2737]. В том же году приложение завоевало престижную награду Apple Design Award[2738]. В наши дни существует множество инструментов для суммаризации текстов на разных языках[2739], [2740], в том числе и на русском (один из таких инструментов был разработан нашей командой[2741]). Обычно их основой являются большие языковые трансформерные модели.
В последние годы получила развитие ещё одна функция языковых моделей, представляющая пользу как для читателей, так и для писателей. Речь идёт о проверке фактов (фактчекинге). Современные языковые модели способны обнаруживать в текстах сомнительные с точки зрения достоверности или спорные утверждения, сверяя их с информацией источников, считающихся достойными доверия[2742], [2743], [2744], [2745], [2746], [2747]. Такие инструменты могут предохранять читателей от заблуждений, а писателям (журналистам, блогерам и т. д.) позволяют создавать более качественный и проверенный контент.
Языковые модели также можно использовать для выявления спама или атак мошенников.
Словом, по мере развития генеративных текстовых моделей эпоха литературного творчества людей вовсе не заканчивается, а скорее переходит на новый уровень — так же, как это произошло с появлением печатного станка или текстовых редакторов для персональных компьютеров.
Во многом дальнейшая судьба таких сервисов, как ChatGPT или GigaChat, зависит от того, как общество воспринимает такие системы и как относится к ним. На мой взгляд, чрезвычайно важно прийти к пониманию того, чем современные генеративные нейросетевые модели являются и чем они совершенно точно не являются. Они — инструмент для генерации контента, подобный графическим или текстовым редакторам, но куда более продвинутый. Раньше людям приходилось рисовать всё от руки, самим выполнять штриховку и закраску, сегодня же этот труд можно переложить на плечи машины. Генеративные модели — это чрезвычайно удобные инструменты, которые потенциально могут нам помочь решить немало задач,