• ВХОД
  •  

    Полное описание

    Томакова, Р. А. Анализ стратегий игровых пространств с использованием нейронных сетей / Р. А. Томакова, В. В. Джабраилов, М. В. Томаков, И. С. Егоров, Д. К. Реутов. - Текст : непосредственный // Юго-Западный государственный университет. Известия Юго-Западного государственного университета : научный рецензируемый журнал. - 2021. - Т. 11, N 2. - С. 51-65. - Библиогр. в конце ст. - ISSN 2223-1536.

    ГРНТИ УДК
    28.23.37004.032.26
    28.23

    Рубрики:
    Искусственный интеллект -- Применение
    Нейронные сети -- Применение

    Кл.слова (ненормированные): нейронные сети -- искусственный интеллект -- ml-agents -- обучение с подкреплением -- оптимизация стратегии -- агенты обучения -- академия -- среда обучения -- unity
    Аннотация: Цель исследования заключается в разработке методов повышения эффективности работы нейронных сетей для построения систем искусственного интеллекта при анализе игрового пространства. Методы. В качестве основного метода, используемого в разрабатываемом программном решении, применялся метод глубинного обучения нейронных сетей с подкреплением, основанный на использовании модели проксимальной оптимизации стратегии. В работе применялся специальный плагин ML-Agents для игрового движка Unity. На его основе были использованы готовые среды для обучения агентов, а также разработаны новые, адаптивно изменяющиеся в процессе реализации игры среды для обучения агентов. Представлена схема взаимодействия среды обучения с системой Python API, приведены компоненты, составляющие плагин. Сформирован цикл обучения с подкреплением, который позволяет сформировать порядок различных состояний, возможные действия игрока в соответствующих ситуациях и потенциальные награды, получаемые им в процессе обучения. Цель заключается в максимизации ожидаемого выигрыша, который возможно получить игроку при выполнении всего цикла обучения. Алгоритм проксимальной оптимизации стратегии в плагине ML-Agents реализован через программную библиотеку для машинного обучения Tensor Flow и выполняется в отдельном процессе Python API, который взаимодействует с запущенной сценой Unity посредством внешнего коммуникатора. Результаты. Показано, что повышение эффективности работы нейронных сетей для последующего обучения искусственного интеллекта достигается, во-первых, за счет использования сверхточных нейронных сетей, а во-вторых, за счет расширения функциональных возможностей, с помощью выбора опорной точки формулы. Заключение. Рассмотрение действий игроков поможет осуществлять разработку программного продукта для анализа игровой стратегии с использованием нейронных сетей, которая автоматически определяет их поведение, направленное на изучение индивидуальных особенностей игрового пространства.
    Доп. точки доступа:
    Джабраилов, В. В.
    Томаков, М.В.
    Егоров, И.С.
    Реутов, Д. К.

    Экз-ры полностью 13c8f2c78f205cdfac2f429ff15f3bee/2021/11/2
    Имеются экземпляры в отделах: всего 1 : ЧЗХР (1)
    Свободных экз. нет
    Экз.1 (ЧЗХР) поступил, но еще не дошел до места хранения;
    Заказаны экз-ры для отделов: ХРЦ

    Держатели документа:
    Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): -237188-695443)

    Шифр в сводном ЭК: 4ce3e944e4e385090a32b1edefd8496b