| |
Формат представления заданий для дорожки контекстно-зависимого
аннотирования текстовых документов
Набор заданий - один xml файл со следующей структурой:
<?xml version="1.0" encoding="windows-1251" ?>
<task-set xmlns:romip="http://www.romip.ru/data/summarization" collectionId="ROMIP-2005-Mixed" id="summarization">
<romip:header xmlns:romip="http://www.romip.ru/data/common">
<romip:version>1.0</romip:version>
<romip:license type="public" uri="http://romip.ru/license/public.html" />
<romip:description>This file contains for ROMIP'2005 track on
query-biased document summarization</romip:description>
</romip:header>
<task id="sum1">
<querytext>приток прута</querytext>
<document id="http://klendo.narod.ru/ARCHIVE/NOVEMBER/AD1123.htm" collectionId="ROMIP-2004-narod.ru"/>
</task>
<task id="sum2">
<querytext> о государственной экспертной деятельности</querytext>
<document id="901850594" collectionId="ROMIP-2004-Legal" />
</task>
...
</task-set>
Тег document содержит идентификатор документа, который определен в
колекции документов с соответствующим collectionId и
для которого необходимо построить аннотацию по запросу, указанному в
теге querytext.
|