ГПНТБ России - Полное описание

Государственная публичная
научно-техническая библиотека России

Основана в 1958 году

Полное описание

Томакова, Р. А. Анализ стратегий игровых пространств с использованием нейронных сетей / Р. А. Томакова, В. В. Джабраилов, М. В. Томаков, И. С. Егоров, Д. К. Реутов. - Текст : непосредственный // Юго-Западный государственный университет. Известия Юго-Западного государственного университета : научный рецензируемый журнал. - 2021. - Т. 11, N 2. - С. 51-65. - Библиогр. в конце ст. - ISSN 2223-1536.

ГРНТИ	УДК
28.23.37	004.032.26
28.23

Рубрики:
Искусственный интеллект -- Применение
Нейронные сети -- Применение

Кл.слова (ненормированные): нейронные сети -- искусственный интеллект -- ml-agents -- обучение с подкреплением -- оптимизация стратегии -- агенты обучения -- академия -- среда обучения -- unity
Аннотация: Цель исследования заключается в разработке методов повышения эффективности работы нейронных сетей для построения систем искусственного интеллекта при анализе игрового пространства. Методы. В качестве основного метода, используемого в разрабатываемом программном решении, применялся метод глубинного обучения нейронных сетей с подкреплением, основанный на использовании модели проксимальной оптимизации стратегии. В работе применялся специальный плагин ML-Agents для игрового движка Unity. На его основе были использованы готовые среды для обучения агентов, а также разработаны новые, адаптивно изменяющиеся в процессе реализации игры среды для обучения агентов. Представлена схема взаимодействия среды обучения с системой Python API, приведены компоненты, составляющие плагин. Сформирован цикл обучения с подкреплением, который позволяет сформировать порядок различных состояний, возможные действия игрока в соответствующих ситуациях и потенциальные награды, получаемые им в процессе обучения. Цель заключается в максимизации ожидаемого выигрыша, который возможно получить игроку при выполнении всего цикла обучения. Алгоритм проксимальной оптимизации стратегии в плагине ML-Agents реализован через программную библиотеку для машинного обучения Tensor Flow и выполняется в отдельном процессе Python API, который взаимодействует с запущенной сценой Unity посредством внешнего коммуникатора. Результаты. Показано, что повышение эффективности работы нейронных сетей для последующего обучения искусственного интеллекта достигается, во-первых, за счет использования сверхточных нейронных сетей, а во-вторых, за счет расширения функциональных возможностей, с помощью выбора опорной точки формулы. Заключение. Рассмотрение действий игроков поможет осуществлять разработку программного продукта для анализа игровой стратегии с использованием нейронных сетей, которая автоматически определяет их поведение, направленное на изучение индивидуальных особенностей игрового пространства.
Доп. точки доступа:
Джабраилов, В. В.
Томаков, М.В.
Егоров, И.С.
Реутов, Д. К.

Экз-ры полностью 13c8f2c78f205cdfac2f429ff15f3bee/2021/11/2
Имеются экземпляры в отделах: всего 1 : ЧЗХР (1)
Свободных экз. нет
Экз.1 (ЧЗХР) поступил, но еще не дошел до места хранения;
Заказаны экз-ры для отделов: ХРЦ

Держатели документа:
Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): -237188-695443)

Шифр в сводном ЭК: 4ce3e944e4e385090a32b1edefd8496b