Шестой российский семинар по Оценке Методов Информационного Поиска
Апрель 2008 - Октябрь 2008
http://romip.ru
К участию приглашаются все заинтересованные лица - как создатели поисковых
систем, так и исследователи, занимающиеся проблемами информационного поиска.
Особенностью РОМИП'2008 является включение в программу семинара
дорожек поиска по изображениям.
Рассматриваемые задачи
Предварительно, программа семинара в 2008 году будет состоять из следующих
секций (дорожек), каждая из которых посвящена оценке методов решения одной
из задач информационного поиска:
классическая задача поиска по запросу
по коллекции нормативно-правовых документов
по Веб-коллекции
по смешанной коллекции
тематическая классификация
нормативно-правовых документов
Веб-сайтов
Веб-страниц
фактографический поиск по новостной коллекции
структуризация новостного потока
контекстно-зависимое аннотирование текстовых документов
поиск похожих документов по документу образцу или фрагменту текста
вопросно-ответный поиск
поиск нечетких дубликатов в коллекции изображений
поиск изображений по визуальному подобию
Окончательный список будет сформирован по результатам обсуждения в
форуме и
поступивших заявок на участие. Подробные описания дорожек и правила
проведения обсуждаются в
списке рассылки РОМИП и будут опубликованы на сайте семинара.
Наборы данных
При проведении оценки используются следующие коллекции (список может
быть расширен):
Коллекция фотографий (в стадии формирования, 20.000+ изображений)
Процедура и условия участия
Все участники подписывают лицензионные соглашения об использовании коллекций
РОМИП исключительно для исследовательских (некоммерческих) целей в рамках
проекта РОМИП.
Участник, получив набор данных и заданий, в оговоренные сроки предоставляет
результат(ы) выполнения заданий своей системы для их независимой оценки,
которая проводится с соблюдением анонимности источника результата.
Поощряется также и решение модифицированных задач на основе используемых
наборов данных.
Участник обязуется предоставить статью с описанием общих принципов
использованного подхода и полученных результатов для публикации в трудах
семинара и сделать доклад на очной части семинара.
Предполагается также, что участники компенсируют часть затрат на
распространение тестовых корпусов и оценку
результатов, пропорционально степени их участия. Компенсировать затраты
можно с помощью оплаты организационного взноса или путем выделения
ресурсов для проведения оценки.
Результаты тестирования предназначены для использования исключительно
в исследовательских целях и не могут быть использованы в маркетинговых или
коммерческих целях.
Очный семинар
В 2008 году предполагается совмещение очной части РОМИП с российской
конференцией по электронным библиотекам
(RCDL'2008), которая пройдет в
Дубне с 7 по 11 октября 2008 года.
Правила подачи заявки
Заявка на участие в семинаре РОМИП должна содержать следующую информацию:
краткая (в 1-2 абзаца) презентация системы на русском и английском
языках (название, Веб-сайт, краткое описание принципов используемого подхода)
контактная информация (организация, email контактного лица)
список дорожек, в которых Вы заинтересованы принять участие
Приём заявок на участие: до 12 мая
Распространение заданий: до 26 мая
Предоставление результатов выполнения заданий: с 15 по 15 июля (по графику)
Результаты оценки: после 15 августа (в зависимости от дорожки)
Тексты докладов: 20 сентября
Очная встреча: один из дней в период с 7 октября по 11 октября
О РОМИП
РОМИП - это инициатива по проведению независимой оценки методов
информационного поиска, ориентированных на работу с русскоязычной
информацией.
Методология организации семинара во многом схожа с известными мировыми
аналогами - американским TREC, европейским CLEF и японским NTCIR.
Отличительной чертой РОМИП является использование русскоязычных коллекций и
активное участие исследователей из России.
Материалы семинаров РОМИП 2003-2007 годов свободно доступны на сайте
семинара.
Цели и аудитория
Основными целями Российского семинара по Оценке Методов Информационного Поиска
являются:
создание и развитие информационных ресурсов, обеспечивающих
исследования в области информационного поиска;
проведение независимой оценки методов информационного поиска,
ориентированных на работу с русскоязычной информацией;
формирование среды для исследования проблем информационного поиска
на актуальных для российского пользователя задачах;
формирование требований к оформлению текстовых коллекций для
тестирования;
формирование "правил игры" - этических норм представления и
использования результатов.
Дополнительными целями проекта являются:
консолидация сообщества российских исследователей и разработчиков,
занимающихся информационным поиском
сотрудничество с зарубежными инициативами по тестированию
систем информационного поиска
расширение контактов с зарубежными исследователями и
разработчиками, занимающимися многоязычным информационным поиском
привлечение широкого внимания к проблемам и перспективам
информационного поиска и интенсификация исследований в этой области в России
создание предпосылок и стимулов для дальнейшего развития
участвующих систем с целью совершенствования качества поиска.
Оргкомитет
Михаил Агеев (МГУ, Москва)
Александр Антонов (Галактика, Москва)
Павел Браславский (Яндекс, УГТУ-УПИ, Екатеринбург)
Наталья Васильева (HP Labs, Санкт-Петербург)
Максим Губин (IAC Search & Media, USA)
Борис Добров (УИС РОССИЯ, Москва)
Михаил Костин (Mail.Ru, Москва)
Игорь Кураленок (Яндекс, ПМПУ СПбГУ, Санкт-Петербург)
Игорь Некрестьянов (мат-мех СПбГУ, Санкт-Петербург)
Основным средством общения и координации в РОМИП является электронная почта.
Для получения оперативной информации и обсуждения вопросов, связанных с
проведением семинара, приглашаем подписаться на рассылку РОМИП: http://www.yahoogroups.com/group/romip.