Дорожка по классификации Веб-страницЗадачаДорожка посвящена оценке методов решения задачи тематической классификации Веб-страниц. Общая процедура проведения дорожки стандартна. КоллекцияИсходный набор данных включает в себя коллекцию BY.web и коллекцию DMOZ, используемую в качестве обучающего множества.Обучающее множество состоит из сайтов, но не обязательно все страницы сайта относятся к одной теме. Формулировка задания для участвующей системыАналогично дорожке по классификации Веб-сайтов, каждой системе-участнику предоставляется список категорий, обучающая выборка и коллекция BY.web. Но в данном случае для обучения используются сайты, а классифицируются индивидуальные страницы BY.web.Ответом системы для категории является упорядоченный по степени близости документа к категории список документов. При оценки будут учитываться только первые 100 документов. Методология оценки
Форматы данных |