Дорожка поиска по документу-образцу
РОМИП

 Новости 
 О проекте 
 Манифест 
 Приглашение к участию 
 Общие принципы 
 Участие в семинаре 
 График 
 Участники 
 Дорожки 
 Тестовые коллекции 
 Таблицы 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Дорожка поиска по документу-образцу

Задача

Дорожка посвящена оценке методов решения задачи традиционной задаче поиска с указанием одного релевантного документа.

Общая процедура проведения дорожки стандартна.

Коллекция

Исходным набором данных является объединение коллекций Narod.ru и коллекци нормативно-правовых документов.

В набор включаются документы из всех архивов - narod.*, legal.* и *_training.*.

Формулировка задания для участвующей системы

Каждой системе предоставляется объединенная коллекция и набор заданий вида запрос и один релевантный документ. Задания строятся на основе того набора заросов, который оценивалался в РОМИП'2003 и РОМИП'2004. Релевантным документом для каждого запроса считаеся документ, оцененный, как строго релевантный, то есть все ассессоры признали его таковым.

Ответ системы, как и для других дорожек по поиску, есть упорядоченный список до 100 документов.

Методолгия оценки

  • постановка задания ассессору (полная инструкция):
    Ассессор оценивает соответствие документов исходному(фразовому) запросу на основе расширенного описания информационной потребности. Соответсвующий запросу документ-образец ассессор не увидит.
  • метод оценки: метод "общего котла" (pooling) c глубиной пула 50
  • шкала оценки релевантности:
    • точно/возможно/вероятно/нет/невозможно оценить
    • да/нет/невозможно оценить
  • официальные метрики
    • точность
    • полнота
    • 11-точечный график TREC

Результаты оценки

Подробное описание методики оценки и официальных метрик можно найти в трудах семинара за 2005 год.

Форматы данных