• ВХОД
  •  

    Полное описание

    Неелова, Н. В. Математическое и программное обеспечение методов схожести WEB-документов и выделение первичного документа из кластера дублей : автореф. дис. ... канд. техн. наук: 05.13.11 / Н. В. Неелова. - 2011. - 20 с. : ил. - Библиогр.: с. 19-20 (12 назв.). - Текст : непосредственный.

    ГРНТИ УДК
    19.31004.775(043)

    Кл.слова (ненормированные): ДУБЛИРОВАННАЯ ИНФОРМАЦИЯ -- ИНТЕРНЕТ -- ИНФОРМАЦИОННЫЙ ПОИСК -- ОПРЕДЕЛЕНИЕ ДУБЛЕЙ -- ПЕРВИЧНЫЙ ДОКУМЕНТ
    Аннотация: Всевозрастающее количество неуникальных документов в Интернете снижает эффективность поиска релевантной информации пользователем и создает трудности для поисковых систем, обусловленные увеличением индексных баз за счет избыточной информации, что приводит к росту затрат на обслуживание и хранение данных, а также требует большей ресурсной подготовки. Разработано программное обеспечение, позволяющее исследовать предложенные методы оценки схожести web-документов на уровне online и offline фильтрации, а также выделения первичного документа из кластера дублей. Модифицирован метод Джаккарда, позволяющий находить дубли при синонимизации аннотаций, улучшая качество определения схожих кратких содержаний и не сильно увеличивая временные затраты на обработку.
    Держатели документа:
    Государственная публичная научно-техническая библиотека России : 123298, г. Москва, ул. 3-я Хорошевская, д. 17 (Шифр в БД-источнике (KATBW): Ар11-21295)

    Шифр в сводном ЭК: 2a678ced15fe3839cb52b46c0be9666a



    Заказ фрагмента документа ₽