Stanford HAI (Human-Centered Artificial Intelligence) только что выпустила выпуск своего Отчета об индексе ИИ за 2023 год, который возглавляет междисциплинарная группа экспертов из академических кругов и промышленности, которая отслеживает и визуализирует данные об ИИ, обеспечивая ответственное и этичное продвижение ИИ. с человекоцентричным подходом.

Я пишу эту статью, потому что, когда я просматривал этот огромный отчет, некоторые из этих статистических данных показались мне действительно важными, а другие просто сбили меня с толку. Эта статья будет содержать резюме первой главы — Глава 1: Исследования и разработки.

Ниже приведены некоторые из наиболее интересных результатов, на мой взгляд.

  1. Количество публикаций об искусственном интеллекте в мире увеличилось более чем удвоилось с 2010 по 2021 год (и, похоже, не собирается сокращаться).

2. Количество публикаций по распознаванию образов и машинному обучению резко возросло за последние пять лет: с 2015 года количество статей по распознаванию образов удвоилось, а по машинному обучению — в четыре раза. В 2021 году компьютерное зрение, алгоритмы и интеллектуальный анализ данных был следующей наиболее публикуемой областью исследований ИИ.

3. С 2010 года больше всего статей по ИИ опубликовала Китайская академия наук. За ней следуют четыре китайских университета — Университет Цинхуа, Университет Китайской академии наук, Шанхайский университет Цзяо Тонг и Чжэцзянский университет.

4. В 2022 году наиболее распространенным классом значительных систем машинного обучения ИИ были выпущены языковые системы ИИ: было выпущено 23 системы. Это примерно в шесть раз больше, чем у следующего по распространенности типа системы, мультимодальных систем.

5. Количество параметров в системах ИИ неуклонно растет с начала 2010-х годов, что отражает рост сложности задач, большую доступность данных и усовершенствование аппаратного обеспечения. Параметры — это числовые значения, полученные моделями машинного обучения, которые определяют, как модель интерпретирует входные данные и делает прогнозы. Настройка параметров важна для оптимизации производительности системы машинного обучения.

Мы также можем заметить, что, хотя наиболее значимые модели машинного обучения были выпущены академическими кругами до 2014 года, с тех пор отрасль переняла более 32 важных моделей машинного обучения, произведенных в отрасли, по сравнению с только тремя, созданными академическими кругами.

На приведенном ниже графике показано, как параметры систем машинного обучения различаются в разных областях. Мы видим, что в последние годы появилось много систем языковых моделей с большим количеством параметров.

6. Хронология больших языковых моделей.

На этой диаграмме показана впечатляющая хронология больших языковых и мультимодальных моделей, выпущенных после GPT-2, а также национальное происхождение исследователей, которые их создали. Известные модели, выпущенные в 2022 году, включают DALL-E 2 от OpenAI и PaLM от Google (540B). Единственной китайской моделью, выпущенной в 2022 году, была впечатляющая двуязычная (английский и китайский) модель Университета Цинхуа, GLM-130B. BLOOM, выпущенный в конце 2022 года, который был неопределенным из-за сотрудничества с более чем 1000 международных исследователей.

Количество параметров в недавно выпущенных больших языковых и мультимодальных моделях со временем значительно увеличилось. Например, PaLM от Google, выпущенный в 2022 году, имел 540 миллиардов параметров, что почти в 360 раз больше, чем у GPT-2, первой модели, выпущенной в 2019 году и имеющей всего 1,5 миллиарда параметров. Среднее число параметров в больших языковых и многомодальных моделях со временем экспоненциально увеличивается.

7. Общее количество проектов GitHub, связанных с ИИ, неуклонно росло с 2011 года, увеличившись с 1536 до 347 934 в 2022 году.

По состоянию на 2022 год значительная часть проектов искусственного интеллекта GitHub была внесена разработчиками программного обеспечения в Индии (24,2%), за которыми следуют Европейский союз и Великобритания (17,3%) и США (14,0%). Доля американских ИИ-проектов GitHub снижается с 2016 года.

В заключение, в первой главе этого отчета об ИИ представлен обзор текущего состояния ИИ, подчеркивая прогресс, достигнутый в различных областях, таких как машинное обучение, компьютерное зрение и обработка естественного языка, а также текущие тенденции. Мы видим быстрый рост технологий искусственного интеллекта, и похоже, что в ближайшие годы он будет расти в геометрической прогрессии.

В ближайшее время я опубликую статью, обобщающую следующие главы этого отчета. Спасибо за чтение!