• ВХОД
  •  

    Полное описание

    Ар11-21295
    Неелова, Н. В. Математическое и программное обеспечение методов схожести WEB-документов и выделение первичного документа из кластера дублей : автореф. дис. ... канд. техн. наук : 05.13.11 / Н. В. Неелова. - Тула : [б. и.], 2011. - 20 с. : ил. - Библиогр.: с. 19-20 (12 назв.). - Текст : непосредственный.
    ГРНТИ УДК
    19.31004.775(043)

    Кл.слова (ненормированные): интернет -- информационный поиск -- дублированная информация -- определение дублей -- первичный документ
    Аннотация: Всевозрастающее количество неуникальных документов в Интернете снижает эффективность поиска релевантной информации пользователем и создает трудности для поисковых систем, обусловленные увеличением индексных баз за счет избыточной информации, что приводит к росту затрат на обслуживание и хранение данных, а также требует большей ресурсной подготовки. Разработано программное обеспечение, позволяющее исследовать предложенные методы оценки схожести web-документов на уровне online и offline фильтрации, а также выделения первичного документа из кластера дублей. Модифицирован метод Джаккарда, позволяющий находить дубли при синонимизации аннотаций, улучшая качество определения схожих кратких содержаний и не сильно увеличивая временные затраты на обработку.Экз-ры полностью Ар11-21295
    Имеются экземпляры в отделах: всего 1 : ХРЦ (1)
    Свободны: ХРЦ (1)



    Заказ фрагмента документа ₽