Новостная коллекция
РОМИП

 Новости 
 О проекте 
 Манифест 
 Приглашение к участию 
 Общие принципы 
 Участие в семинаре 
 График 
 Участники 
 Дорожки 
 Тестовые коллекции 
 Таблицы 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Новостная коллекция

Описание

Коллекция предоставлена компанией Яндекс и содержит новости из следующих источников:

Коллекция охватывает следующие временные интервалы:

  • с 18.11.2003 по 24.11.2003 включительно (8 дней) - "отставка Шеварднадзе"
  • с 01.12.2003 по 09.12.2003 включительно (8 дней) - "Взрыв в Ессентуках - Выборы в Госдуму"
  • с 31.03.2004 по 7.04.2004 (8 дней) - "обычная неделя"

Статистика по набору данных
  • Объем данных: 75 Mb
  • Число документов: ~31 500
  • Кодировка: cp1251
Права на использование

Права на использование в целях РОМИП предоставлены компанией Яндекс, являющейся владельцем коллекции. Для получения доступа к коллекции необходимо подписать соглашение об использовании данных.

Формат

Коллекция распространяется в виде 3-х xml файлов (формат данных).

Список дорожек, в которых использовалась коллекция
  • кластеризация новостного потока
  • фактографический поиск
В дорожках РОМИП'2005 использовалась старая новостная коллекция 2005 года.
Бурение - фундамент на буронабивных сваях, стоимость.