• ВХОД
  •  

    Полное описание


    Сакулин, С. А. Синтез функции награды в обучении с подкреплением средствами когнитивной графики / С. А. Сакулин, А. Н. Алфимцев. - DOI 10.14489/vkit.2022.08.pp.026-036. - Текст : непосредственный // Вестник компьютерных и информационных технологий : ежемесячный научно-технический и производственный журнал. - 2022. - Том 19, N 8. - С. 26-36. - Библиогр. в конце ст. - ISSN 1810-7206.
    (Шифр в БД У3208/2022/19/8)
    ГРНТИ УДК
    28.23.25004.852
    РУБ ИИ
    04.07

    Рубрики:
    Машинное обучение
    Искусственный интеллект

    Кл.слова (ненормированные): операторы агрегирования -- виртуальная реальность -- трехмерная когнитивная графика -- формализация экспертных знаний -- мультиагентное обучение -- функция награды -- обучение с подкреплением
    Аннотация: В мультиагентном машинном обучении с подкреплением необходим синтез функции награды. При этом возникают трудности, связанные с отсутствием интуитивного видения процесса агрегирования у многих практических специалистов. В статье предложен метод синтеза функции награды на основе применения трехмерной когнитивной графики. Функция награды представлена в виде оператора агрегирования. Свойства этого оператора напрямую связаны со свойствами физического объекта, в отношении которого хорошо развито интуитивное представление. В качестве такого объекта выступает абсолютно твердая плоскость, закрепленная на линии опоры пружинами. Результату агрегирования соответствует угол отклонения плоскости от горизонта. Для проверки результативности предложенного метода поставлен эксперимент, в ходе которого реализован синтез функции награды в обучении с подкреплением агентов на основе этой функции в среде компьютерной игры StarCraft II. Обучение проводилось для существующей функции награды и для функции, построенной посредством синтеза.
    Доп. точки доступа:
    Алфимцев, Александр Николаевич

    Экз-ры полностью У3208/2022/19/8
    Имеются экземпляры в отделах: всего 2 : ЧЗХР (1), ХРЦ (1)
    Свободны: ЧЗХР (1), ХРЦ (1)
    Переход по DOI



    Заказ фрагмента документа ₽