Формат представления результатов для дорожки по поиску фактов
РОМИП

 Новости 
 О проекте 
 Манифест 
 Приглашение к участию 
 Общие принципы 
 Участие в семинаре 
 График 
 Участники 
 Дорожки 
 Тестовые коллекции 
 Таблицы 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Формат представления результатов для дорожки по поиску фактов

Предполагается, что результат представляет собой XML файл или набор XML файлов, каждый из которых содержит ответы для одного или нескольких заданий (т.е. запросов).

Структура XML следующая:

<romip:taskresult xmlns="http://www.romip.ru/data/qa" xmlns:romip="http://www.romip.ru/data/common" trackId="ROMIP-2004-QA">
  <romip:run>
    <romip:systemID>yellow</romip:systemID>
    <romip:runID>1</romip:runID>
  </romip:run>
  <result frame-length="150">
    <task id="qa1">
      <fact sourceDocumentId="http://aaa.narod.ru/a.html" offset="238" length="95">
       <class id="Category1"/>
       <class id="Category2"/>
       <text>passage text</text>
      </fact>
    </task>
  </result>
</romip:taskresult>
Блок run характеризует систему с помощью которой были предоставлены результаты. systemID - идентификатор системы, которые был предоставлен организаторами при регистрации. runID - идентификатор модификации системы, которая использовалась для этого прогона (характеризует параметры эксперимента), - его форма определяется участником самостоятельно.

аттрибут frame-length у тэга result определяет максимальную длину фрагментов (разрешенные значения 150 и 300)
sourceDocumentId - индентификатор документа (docId) из коллекции
offset и length - отступ и длина фрагмента в исходном документе в байтах
class - опциональный тэг для ссылки на категорию к которой относится этот факт (идентификатор категории определен в словаре категорий для этой дорожки). Разрешено от 0 до 3-х тегов.
text - собственно текст фрагмента, содержащего описание факта, без html разметки.