Тестовые коллекции РОМИП
РОМИП

 Новости 
 О проекте 
 Манифест 
 Приглашение к участию 
 Общие принципы 
 Участие в семинаре 
 График 
 Участники 
 Дорожки 
 Тестовые коллекции 
 Таблицы 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Тестовые коллекции РОМИП

Нами были подготовлены следующие тестовые коллекции:
  • Веб коллекция Narod.ru
    Псевдослучайная выборка сайтов из домена narod.ru объемом 728 000 документов.

  • Веб коллекция KM.ru 2007 (NEW)
    Копия мультипортала www.km.ru объемом 3 000 000 документов.

  • Веб коллекция BY.web 2007 (NEW)
    Коллекция представляет собой выборку из страниц домена .by, присутствовавших в индексе поисковой системы Яндекс по состоянию на май 2007 года

  • Веб коллекция DMOZ
    Колекция, созданная на основе русскоязычной части каталоа dmoz.org с целью получения разумного обучающего множества для задачи классификации Веб-сайтов и Веб-страниц.

  • Коллекция нормативных документов 2004
    Коллекция нормативно-правовых документов законодательства Российской Федерации, сформированная в 2004 году.

  • Коллекция нормативных документов 2007 (NEW)
    Коллекция нормативно-правовых документов законодательства Российской Федерации, сформированная в 2007 году.

  • Новостная коллекция
    Набор, содержащий новостные сообщения из 25 источников и охватывающий 3 временных интервала (около 31 500 документов).