Полное описание
> Зайцев, М. Д. Разработка метода предварительного анализа обучающих данных для систем автоматического распознавания речи = Development of the method for preliminary analysis of training data for automatic speech recognition system / М. Д. Зайцев, Д. А. Копылов, О. В. Хомутская. - Текст : непосредственный // Научно-технический вестник Поволжья : журнал. - 2023. - N 5. - С. 129-132. - Библиогр. в конце ст. - ISSN 2079-5920.
ГРНТИ | УДК | |
16.31.21 | 004.934.2 | |
28.23.25 | 004.85 |
Рубрики:
Речевые сигналы -- Распознавание
Кл.слова (ненормированные): визуализация -- фонетические отношения -- анализ обучающих данных -- распознавание речи -- аудиоданные -- обучение
Аннотация: Разработка систем автоматического распознавания речи часто требует предварительного анализа обучающих аудиоданных. В данной работе предлагается адаптация метода интерпретации визуального представления обучающих данных. Адаптированный метод предполагает выделение фрагментов аудиозаписей, содержащих произнесение конкретной фонемы, получение мел-кепстральных коэффициентов для спектральных характеристик и применение алгоритма снижения размерности t-SNE для двухмерной визуализации. Полученные визуализации позволили выявить сложные взаимосвязи между фонемами, которые выходят за рамки акустического сходства. Это демонстрирует важность учета артикуляционных, акустических и перцептивных аспектов звуков речи при обучении моделей автоматического распознавания речи.
Доп. точки доступа:
Копылов, Д.А.
Хомутская, Ольга Владиславовна
>
Имеются экземпляры в отделах: всего 2 : ЧЗХР (1), ХРЦ (1)
Свободны: ЧЗХР (1), ХРЦ (1)
Держатели документа:
Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): -775875-715565)>
Шифр в сводном ЭК: c8d319633961b478dd6cc91677041cde
Заказ фрагмента документа ₽