Формат представления результатов для
дорожки классификации
Результат классификации представляется в виде одного XML файла
или нескольких файлов, каждый из которых содержит содержит списки
назначенных категорий для некоторого множества классифицируемых сайтов.
XML файл должен иметь следующую структуру:
<taskresult xmlns="http://www.romip.ru/data/common">
<run>
<systemID>yellow</systemID>
<runID>1</runID>
</run>
<collectionID>narod.ru</collectionID>
<tasksetID>narod.ru-classification</tasksetID>
<result>
<site name="romip.narod.ru">
<category>100</category>
</site>
<site name="realjunk.narod.ru">
</site>
<site name="all-in-one.narod.ru">
<category>100</category>
<category>107</category>
<category>147</category>
</site>
....
</result>
</taskresult>
Блок run характеризует систему с помощью которой были предоставлены
результаты. systemID - идентификатор системы, которые был предоставлен
организаторами при регистрации.
runID - идентификатор модификации системы, которая использовалась для этого
прогона (характеризует параметры эксперимента), - его форма определяется
участником самостоятельно.
Блок result собственно описывает к каким темам относятся классифицируемые
документы. Для каждого классифицируемого сайта идентификаторы назначенных
ему категорий перечисляются в виде списка тегов category,
а название сайта указывается,
как значение аттрибута name тега site.
Внимание: Для ограничения объема выдаваемых
результатов установлен максимальный предел в пять категорий для одного
документа.
|