[РОМИП] Формат представления результатов

Новости
Правила
Заявка на участие
График
Дорожки:
   Поиск
   Классификация
Участники
Организация
FAQ
Форум

   Формат представления результатов для дорожки классификации

Результат классификации представляется в виде одного XML файла или нескольких файлов, каждый из которых содержит содержит списки назначенных категорий для некоторого множества классифицируемых сайтов.

XML файл должен иметь следующую структуру:

<taskresult xmlns="http://www.romip.ru/data/common">
  <run>
    <systemID>yellow</systemID>
    <runID>1</runID>
  </run>

  <collectionID>narod.ru</collectionID>
  <tasksetID>narod.ru-classification</tasksetID>

  <result>
    <site name="romip.narod.ru">
      <category>100</category>
    </site>

    <site name="realjunk.narod.ru">
    </site>

    <site name="all-in-one.narod.ru">
      <category>100</category>
      <category>107</category>
      <category>147</category>
    </site>

    ....

 </result>
</taskresult>

Блок run характеризует систему с помощью которой были предоставлены результаты. systemID - идентификатор системы, которые был предоставлен организаторами при регистрации. runID - идентификатор модификации системы, которая использовалась для этого прогона (характеризует параметры эксперимента), - его форма определяется участником самостоятельно.

Блок result собственно описывает к каким темам относятся классифицируемые документы. Для каждого классифицируемого сайта идентификаторы назначенных ему категорий перечисляются в виде списка тегов category, а название сайта указывается, как значение аттрибута name тега site.

Внимание: Для ограничения объема выдаваемых результатов установлен максимальный предел в пять категорий для одного документа.

Hitachi: кондиционеры Москва, прайс.