Полное описание
> Яцко, В. А. Метод автоматической классификации текстов, основанный на законе Ципфа / В. А. Яцко. - Текст : непосредственный // НТИ. Сер. 2, Информ. процессы и системы. - 2015. - № 5. - С. 19--24. - Библиогр.: 15 назв.
ГРНТИ | РУБ |
6 |
Аннотация: Описывается метод автоматической классификации текстов, основанный на анализе отклонения распределения слов от закона Ципфа в сочетании с зональной обработкой данных. Под отклонением понимается разница между реальным числовым коэффициентом слова и коэффициентом, который у него должен быть в соответствии с законом Ципфа. Применение метода предусматривает разбивку входного и эталонного текстов на зоны J0, J1, J2 и создание на основе слов, входящих в зону J0, числового ряда, в котором указываются разницы между реальными коэффициентами слов и коэффициентами, вычисляемыми по закону Ципфа. Предложенный метод позволяет существенно снизить размерность текстов и повысить быстродействие автоматической классификации.
Держатели документа:
Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): -736948-332832)>
Шифр в сводном ЭК: 41bf38fea8d477b93cd427c2c23d9347