litbaza книги онлайнРазная литератураОхота на электроовец. Большая книга искусственного интеллекта - Сергей Сергеевич Марков

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 187 188 189 190 191 192 193 194 195 ... 482
Перейти на страницу:
пользователей. Многочисленные животворящие источники данных питают индустрию машинного обучения, обеспечивая её бурное цветение.

6 Час настал. Да грянет бал!

— Бал! — пронзительно визгнул кот, и тотчас Маргарита вскрикнула и на несколько секунд закрыла глаза. Бал упал на неё сразу в виде света, вместе с ним — звука и запаха. Уносимая под руку Коровьевым, Маргарита увидела себя в тропическом лесу. Красногрудые зеленохвостые попугаи цеплялись за лианы, перескакивали по ним и оглушительно кричали: «Я восхищён!»

Михаил Булгаков. Мастер и Маргарита

6.1 ИИ сейчас — большой интерес, обширные вложения и хорошие прогнозы

В 2019 г. Джеффри Дин из Google поделился с публикой своей презентацией под названием «Глубокое обучение для решения сложных проблем» (Deep Learning to Solve Challenging Problems). На первом же слайде презентации был приведён график, показывающий количество научных работ в области машинного обучения, размещаемых ежегодно на сервисе для публикации препринтов (предшествующих публикации предварительных версий статей) arXiv.org. В 2018 г. их число превысило 35 000, что означает, что в 2018 г. в день на arXiv.org публиковалось около 100 новых статей по данной тематике. Это более чем в 30 раз превосходит показатель 2009 г. Вспомогательная шкала на графике, представленном Дином, позволяет оценить, во сколько раз увеличилось число статей по сравнению с базовым 2009 г. Всего за девять лет количество статей выросло примерно в 32 раза.

Рис. 117. Рост числа статей в области машинного обучения

Таким образом, рост числа статей происходил немного быстрее, чем количество элементов микросхем в законе Мура (в два раза каждые два года), причём отрыв особенно усилился после 2015 г.[1760]

Впрочем, показатель, избранный Дином, нельзя признать до конца удачным. Дело в том, что за это же время общее количество препринтов статей на arXiv.org также существенно выросло — с примерно 65 000 в 2009 г. до почти 140 000 в 2018 г.[1761] Поэтому если посмотреть на долю публикаций по машинному обучению от общего их числа, то рост будет немного более скромным, но всё же более чем впечатляющим — с 1,7 до 25%.

Если использовать для анализа другой источник, а именно Scopus от Elsevier — крупнейшую в мире базу данных рецензируемых и цитируемых публикаций, то наблюдаемый здесь рост будет уже не столь впечатляющий, но по-прежнему многократный. По данным стэнфордского ежегодного доклада Artificial Intelligence Index Report за 2019 г. (AIIR-2019), в конце 1990-х гг. на тематику, связанную с ИИ, приходилось менее 1% научных статей и около 3% публикаций по итогам научных конференций. К 2018 г. оба показателя выросли приблизительно втрое, до 3 и 9% соответственно[1762]. Такая существенная разница в показателях arXiv.org и Scopus, по всей видимости, объясняется двумя факторами. Во-первых, область ИИ ещё 10–20 лет назад была в меньшей мере связана с машинным обучением. В наши дни некоторые публицисты вообще ставят знак равенства между ИИ и машинным обучением, хотя машинное обучение — это лишь одна из отраслей ИИ. Многие системы ИИ, упомянутые нами ранее, либо вовсе обходились без применения машинного обучения (например, Logical Theorist), либо использовали его в качестве неосновной техники (например, Deep Blue или Chinook). Поэтому графики, построенные для arXiv.org и Scopus, всё-таки отражают динамику разных показателей. Во-вторых, современное сообщество специалистов в области машинного обучения активно выступает за максимальную открытость исследований в данной области. И это проявляется не только в создании проектов, подобных OpenAI (некоммерческой исследовательской компании из Сан-Франциско, основанной Илоном Маском, президентом венчурного фонда Y Combinator Сэмом Альтманом и рядом других видных исследователей и предпринимателей), но и, например, в бойкоте, объявленном журналу Nature Machine Intelligence со стороны ведущих исследователей в области машинного обучения (в числе которых, например, Джеффри Хинтон, Ян Лекун, Йошуа Бенджио и другие знаменитые учёные) в знак протеста против политики закрытого доступа к публикациям[1763].

В различных областях информатики доля публикаций, доступных в виде препринтов на arXiv.org, весьма различна. Машинное обучение — один из лидеров по данному показателю. Более 60% работ, относящихся к этой области, выложено авторами в публичный доступ. Для многих других областей информатики этот показатель близок к нулю. При этом в целом популярность arXiv.org среди исследователей в области информатики быстро растёт. В 2007 г. на arXiv.org в виде препринтов был доступен всего 1% публикаций по информатике, а в 2017 г. — уже 23%[1764]. Таким образом, существенный вклад в неравенство показателей Scopus и arXiv.org вносит, по всей видимости, растущая открытость исследований в области машинного обучения.

Так или иначе, в новом тысячелетии мы видим многократный рост количества публикаций, посвящённых ИИ и машинному обучению. Это, впрочем, не единственный показатель, свидетельствующий о наступлении новой весны ИИ. Помимо улучшения конкретных инженерных метрик (например, качества распознавания котиков на картинках), о которых мы поговорим немного позже, крайне важной является динамика экономических показателей, свидетельствующих о растущем влиянии прогресса в области ИИ на мировую экономику.

Авторы AIIR-2021 (аналогичного доклада Artificial Intelligence Index Report уже за 2021 г.) уделяют около десятка страниц своего отчёта анализу динамики рынка труда для специальностей, связанных с ИИ. Для этого они используют данные LinkedIn[1765], включив в анализ страны, для которых покрытие рынка труда данными LinkedIn составило более 40% и в каждый из рассмотренных месяцев (2016 и 2020 гг.) набиралось хотя бы 10 человек, у которых в профиле присутствовал хотя бы один навык из области ИИ и которые в тот же месяц добавили в свою анкету новое место работы с датой начала, соответствующей этому же месяцу (для простоты мы будем называть владельцев таких профилей «людьми, получившими новую работу в области ИИ»). Также в анализ были включены Индия и Китай, хотя покрытие их рынка труда данными LinkedIn составляло менее 40%. В итоге в списке оказалось 25 стран. Для них авторы AIIR-2021 посчитали «индекс найма в ИИ» (AI Hiring Index), сначала рассчитав, какую долю в каждом из проанализированных месяцев составляли профили людей, получивших новую работу в области ИИ, от общего числа профилей LinkedIn для данной страны, а затем разделив полученное среднемесячное значение для 2020 г. на среднемесячное значение 2016 г. В итоге для всех 25 стран были получены значения в диапазоне от 3,4 (Бразилия) до примерно 1,25 (Китай) с медианным значением около 2 (смысл данных значений — это индекс, насколько чаще люди начали находить работу

1 ... 187 188 189 190 191 192 193 194 195 ... 482
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?