• ВХОД
  •  

    Полное описание

    Сакулин, С. А. Синтез функции награды в обучении с подкреплением средствами когнитивной графики / С. А. Сакулин, А. Н. Алфимцев. - DOI 10.14489/vkit.2022.08.pp.026-036. - Текст : непосредственный // Вестник компьютерных и информационных технологий : ежемесячный научно-технический и производственный журнал. - 2022. - Том 19, N 8. - С. 26-36. - Библиогр. в конце ст. - ISSN 1810-7206.

    ГРНТИ УДК
    28.23.25004.852

    Рубрики:
    Машинное обучение
    Искусственный интеллект

    Кл.слова (ненормированные): операторы агрегирования -- виртуальная реальность -- трехмерная когнитивная графика -- формализация экспертных знаний -- мультиагентное обучение -- функция награды -- обучение с подкреплением
    Аннотация: В мультиагентном машинном обучении с подкреплением необходим синтез функции награды. При этом возникают трудности, связанные с отсутствием интуитивного видения процесса агрегирования у многих практических специалистов. В статье предложен метод синтеза функции награды на основе применения трехмерной когнитивной графики. Функция награды представлена в виде оператора агрегирования. Свойства этого оператора напрямую связаны со свойствами физического объекта, в отношении которого хорошо развито интуитивное представление. В качестве такого объекта выступает абсолютно твердая плоскость, закрепленная на линии опоры пружинами. Результату агрегирования соответствует угол отклонения плоскости от горизонта. Для проверки результативности предложенного метода поставлен эксперимент, в ходе которого реализован синтез функции награды в обучении с подкреплением агентов на основе этой функции в среде компьютерной игры StarCraft II. Обучение проводилось для существующей функции награды и для функции, построенной посредством синтеза.
    Доп. точки доступа:
    Алфимцев, Александр Николаевич

    Экз-ры полностью 980cf39bfb355507c71b5be32f61e1e0/2022/19/8
    Нет сведений об экземплярах
    Держатели документа:
    Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): -618251-098031)

    Шифр в сводном ЭК: 11d2a31c8b848f2a6f343272fb4ad2bf




    Заказ фрагмента документа ₽