Полное описание
> Неелова, Н. В. Математическое и программное обеспечение методов схожести WEB-документов и выделение первичного документа из кластера дублей : автореф. дис. ... канд. техн. наук: 05.13.11 / Н. В. Неелова. - 2011. - 20 с. : ил. - Библиогр.: с. 19-20 (12 назв.). - Текст : непосредственный.
ГРНТИ | УДК | |
19.31 | 004.775(043) |
Кл.слова (ненормированные): ДУБЛИРОВАННАЯ ИНФОРМАЦИЯ -- ИНТЕРНЕТ -- ИНФОРМАЦИОННЫЙ ПОИСК -- ОПРЕДЕЛЕНИЕ ДУБЛЕЙ -- ПЕРВИЧНЫЙ ДОКУМЕНТ
Аннотация: Всевозрастающее количество неуникальных документов в Интернете снижает эффективность поиска релевантной информации пользователем и создает трудности для поисковых систем, обусловленные увеличением индексных баз за счет избыточной информации, что приводит к росту затрат на обслуживание и хранение данных, а также требует большей ресурсной подготовки. Разработано программное обеспечение, позволяющее исследовать предложенные методы оценки схожести web-документов на уровне online и offline фильтрации, а также выделения первичного документа из кластера дублей. Модифицирован метод Джаккарда, позволяющий находить дубли при синонимизации аннотаций, улучшая качество определения схожих кратких содержаний и не сильно увеличивая временные затраты на обработку.
Держатели документа:
Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): Ар11-21295)>
Шифр в сводном ЭК: 2a678ced15fe3839cb52b46c0be9666a
Заказ фрагмента документа ₽