Полное описание
>
Авдеева, Н. А. Метрики оценки тематической сегментации текстов / Н. А. Авдеева, К. К. Боярский. - Текст : непосредственный // Инфраструктура научных информационных ресурсов и систем : сб. избр. науч. ст. [Пятого Всерос. симп., 6-8 окт. 2015 г., Санкт-Петербург] / Рос. акад. наук, Вычисл. центр им. А. А. Дородницына. - М. : ВЦ РАН, 2015. - С. 74--80. - Библиогр.: 11 назв. - ISBN 978-5-91601-127-2.
(Шифр в БД Д10-15/29412)
ГРНТИ | УДК | |
16.31.21 | 001:004(062) |
Аннотация: Рассматриваются методы проверки качества тематической сегментации текстов на примере "низкоконтрастных" текстов из монографий на русском языке. В качестве базового алгоритма сегментации был выбран TextTiling, анализирующий связность между соседними частями текста. Рассмотрено несколько способов вычисления меры сходства частей текста. Исследована взаимозависимость таких параметров как полнота, точность и уровень шума при сегментации, а также их влияние на оценку качества анализа. На примере русского языка подтверждено, что подключение внешнего семантического классификатора существенно повышает качество сегментации.
Доп. точки доступа:
Боярский, К.К.
Российская академия наук. Вычислительный центр им. А. А. Дородницына
>
Имеются экземпляры в отделах: всего 1 : ХРЦ (1)
Свободны: ХРЦ (1)
Заказ фрагмента документа ₽