Формат представления результатов
РОМИП

 Новости 
 О проекте 
 Манифест 
 Приглашение к участию 
 Общие принципы 
 Участие в семинаре 
 График 
 Участники 
 Дорожки 
 Тестовые коллекции 
 Таблицы 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Формат представления результатов для дорожки классификации

Результат классификации представляется в виде одного XML файла или нескольких файлов, каждый из которых содержит содержит списки назначенных категорий для некоторого множества классифицируемых сайтов.

XML файл должен иметь следующую структуру:

<taskresult xmlns="http://www.romip.ru/data/common">
  <run>
    <systemID>yellow</systemID>
    <runID>1</runID>
  </run>

  <collectionID>narod.ru</collectionID>
  <tasksetID>narod.ru-classification</tasksetID>

  <result>
    <site name="romip.narod.ru">
      <category>100</category>
    </site>

    <site name="realjunk.narod.ru">
    </site>

    <site name="all-in-one.narod.ru">
      <category>100</category>
      <category>107</category>
      <category>147</category>
    </site>

    ....

 </result>
</taskresult>
Блок run характеризует систему с помощью которой были предоставлены результаты. systemID - идентификатор системы, которые был предоставлен организаторами при регистрации. runID - идентификатор модификации системы, которая использовалась для этого прогона (характеризует параметры эксперимента), - его форма определяется участником самостоятельно.

Блок result собственно описывает к каким темам относятся классифицируемые документы. Для каждого классифицируемого сайта идентификаторы назначенных ему категорий перечисляются в виде списка тегов category, а название сайта указывается, как значение аттрибута name тега site.

Внимание: Для ограничения объема выдаваемых результатов установлен максимальный предел в пять категорий для одного документа.