litbaza книги онлайнРазная литератураОхота на электроовец. Большая книга искусственного интеллекта - Сергей Сергеевич Марков

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 204 205 206 207 208 209 210 211 212 ... 482
Перейти на страницу:
уже в 12 лет первый профессиональный дан, и выиграл с тех пор 18 чемпионатов мира.

Некоторые СМИ называли Ли Седоля чемпионом мира, но это было не вполне корректно, поскольку в го просто не существует титула абсолютного чемпиона мира — различные ассоциации проводят множество турниров по разным правилам, присуждая победителям различные международные титулы. На момент начала матча с AlphaGo Ли Седоль занимал второе место в мире по числу международных титулов, уступая только Каменному Будде — Ли Чхан Хо, к тому моменту уже завершившему игровую карьеру.

В мире го Седоль пользовался огромным уважением благодаря своему неортодоксальному и творческому стилю, а в родной Южной Корее он был настоящим национальным героем.

Ли Седоль считал, что без труда одолеет AlphaGo, о чём открыто говорил в предматчевых интервью. Впрочем, это было неудивительно — он находился на пике своей карьеры. Всего за несколько недель до начала матча с AlphaGo Седоль завоевал корейский титул мёнина, одержав победу в одном из наиболее престижных чемпионатов.

Эксперты, внимательно изучившие игры AlphaGo против Фань Хуэя, обнаружили несколько ошибок, допущенных программой, что придавало уверенности болельщикам Ли Седоля и ему самому. Однако до первой игры матча было неизвестно, насколько сила игры программы улучшилась со времени октябрьского матча.

Матч из пяти партий изначально планировался как грандиозное шоу, по масштабу не уступающее матчу Каспарова с Deep Blue. Совпадал даже размер призового фонда, который составил ровно миллион долларов. В качестве места проведения матча был выбран отель Four Seasons в Сеуле. Все игры транслировались в прямом эфире с комментариями профессионала го девятого дана Майкла Редмонда и управляющего редактора электронного журнала «Американское го» Криса Гарлока. Обзор первой партии матча, выполненный на китайском языке Ке Цзе и ещё одним профессионалом девятого дана — сильнейшим игроком Китая Гу Ли, посмотрело около 60 млн зрителей.

Программный код AlphaGo работал на серверах Google Cloud Platform в Соединённых Штатах, а ходы игроков пересылались через всемирную сеть. Каждому из участников было отведено два часа на партию, потом 60 секунд на ход без накопления времени, но с тремя дополнительными минутами на игру.

Перед началом матча давались самые разные прогнозы, причём нельзя сказать, что специалисты по ИИ и эксперты по го были склонны делать ставки на представителей собственного лагеря. Например, Шеффер считал, что победу в матче одержит Седоль, в то время как Ли Хаджин, профессиональный игрок и генеральный секретарь Международной федерации го, считала, что оба игрока имеют равные шансы на победу.

В первой партии матча, состоявшейся 9 марта 2016 г., корейский мастер сдался в безнадёжной позиции после 186-го хода, и всему миру стало ясно: со времени матча с Фань Хуэем команда AlphaGo (к которой присоединился и сам Фань Хуэй) не теряла времени даром. Но если после первой партии у кого-то ещё оставались иллюзии по поводу уровня игры программы, то они развеялись после второй и третьей партий матча. Доведя счёт до 3 : 0, AlphaGo досрочно стала победителем, однако матч был доигран: в четвёртой партии Ли Седолю удалось в упорной борьбе размочить счёт, но в последней игре машина вновь одержала победу. Итоговый счёт матча 4 : 1 стал для многих полной неожиданностью. Подспудно многие болельщики ожидали, что противостояние человека и машины в такой традиционно сложной для машин игре, как го, растянется как минимум на несколько лет. Путь к победе команд Шеффера в шашках и Фэнсюна Сюя в шахматах занял много лет и был полон трудностей и временных неудач, в то время как DeepMind преодолела его, казалось, играючи.

Стартап DeepMind Technologies был основан Демисом Хассабисом, Шейном Леггом и Мустафой Сулейманом в 2010 г. Хассабис и Легг познакомились в подразделении вычислительной нейробиологии Гэтсби (Gatsby Computational Neuroscience Unit) Университетского колледжа Лондона (University College London, UCL). Первой пробой пера для DeepMind стало создание систем ИИ, способных играть в старинные компьютерные аркады, такие как Breakout, Pong и Space Invaders. Специалисты компании стремились создать системы, способные овладеть игрой без предварительного знания её правил. В числе инвесторов DeepMind были крупные венчурные компании, такие как Horizons Ventures и Founders Fund, а также частные предприниматели, такие как Скотт Банистер, Питер Тиль, Яан Таллинн и Илон Маск. В январе 2014 г. Google приобрела DeepMind за 500 млн долларов, обойдя на повороте другого потенциального покупателя — Facebook. В 2014 г. DeepMind получила награду «Компания года» от Кембриджской компьютерной лаборатории (Cambridge Computer Laboratory).

Ли Седоль принёс публичные извинения за своё поражение, заявив после третьей игры, что «неправильно оценил возможности AlphaGo и чувствовал себя бессильным». Он подчеркнул, что поражение было «поражением Ли Седоля», а не «поражением человечества». Также он не преминул заметить, что «роботы никогда не поймут всю прелесть игры так, как мы, люди», и назвал свой результат в четвёртой партии бесценной победой, которую он не обменял бы ни на что.

Мюррей Кэмпбелл из команды Deep Blue назвал победу AlphaGo «концом эпохи» и заявил, что с настольными играми удалось более или менее разобраться и что пришло время двигаться дальше.

После окончания матча, 17 марта 2016 г. правительство Южной Кореи объявило, что в течение следующих пяти лет инвестирует 1 трлн вон (около 860 млн долларов) в исследования в области ИИ[1947].

За выдающиеся достижения в области искусственного интеллекта команда AlphaGo получила медаль Марвина Минского от Международных объединённых конференций по ИИ (International Joint Conferences on Artificial Intelligence, IJCAI). «AlphaGo — это замечательное достижение, прекрасный пример того, ради чего была учреждена медаль Минского», — сказал профессор Майкл Вулдридж, председатель комитета по наградам IJCAI. «Что особенно впечатлило IJCAI, так это то, что AlphaGo достигла своего результата благодаря блестящему сочетанию классических методов ИИ и современных технологий машинного обучения, тесно связанных с DeepMind. Это потрясающая демонстрация современного искусственного интеллекта, и мы рады возможности отметить его с помощью этой награды»[1948].

6.2.3.2 Методы в основе AlphaGo

О каких же методах в данном случае шла речь?

В основе AlphaGo лежит переборный алгоритм под названием «метод Монте-Карло для поиска по дереву» (Monte-Carlo Tree Search, MCTS). Существует множество модификаций данного алгоритма, но объединяющим их свойством является то, что MCTS исследует некоторое количество траекторий в игровом дереве, выбирая их при помощи алгоритма генерации псевдослучайных чисел. При этом распределение вероятностей (т. е. закономерность, описывающая область возможных значений случайной величины и вероятности появления этих значений) при выборе хода в конкретном узле дерева определяется при помощи различных математических моделей, которые могут принимать в расчёт как различные признаки позиции,

1 ... 204 205 206 207 208 209 210 211 212 ... 482
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?