• ВХОД
  •  

    Полное описание

    Зайцев, М. Д. Разработка метода предварительного анализа обучающих данных для систем автоматического распознавания речи = Development of the method for preliminary analysis of training data for automatic speech recognition system / М. Д. Зайцев, Д. А. Копылов, О. В. Хомутская. - Текст : непосредственный // Научно-технический вестник Поволжья : журнал. - 2023. - N 5. - С. 129-132. - Библиогр. в конце ст. - ISSN 2079-5920.

    ГРНТИ УДК
    16.31.21004.934.2
    28.23.25004.85

    Рубрики:
    Речевые сигналы -- Распознавание

    Кл.слова (ненормированные): визуализация -- фонетические отношения -- анализ обучающих данных -- распознавание речи -- аудиоданные -- обучение
    Аннотация: Разработка систем автоматического распознавания речи часто требует предварительного анализа обучающих аудиоданных. В данной работе предлагается адаптация метода интерпретации визуального представления обучающих данных. Адаптированный метод предполагает выделение фрагментов аудиозаписей, содержащих произнесение конкретной фонемы, получение мел-кепстральных коэффициентов для спектральных характеристик и применение алгоритма снижения размерности t-SNE для двухмерной визуализации. Полученные визуализации позволили выявить сложные взаимосвязи между фонемами, которые выходят за рамки акустического сходства. Это демонстрирует важность учета артикуляционных, акустических и перцептивных аспектов звуков речи при обучении моделей автоматического распознавания речи.
    Доп. точки доступа:
    Копылов, Д.А.
    Хомутская, Ольга Владиславовна

    Экз-ры полностью 3d7f4a3c7001f6f8f9cb76f098ec3eca/2023/5
    Имеются экземпляры в отделах: всего 2 : ЧЗХР (1), ХРЦ (1)
    Свободны: ЧЗХР (1), ХРЦ (1)
    Держатели документа:
    Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): -775875-715565)

    Шифр в сводном ЭК: c8d319633961b478dd6cc91677041cde




    Заказ фрагмента документа ₽