Сроки предоставления результатов участниками перенесены на:
19 июня: классификация сайтов
19 июня: поиск по нормативной коллекции, поиск по смешанной коллекции,поиск по документу-образцу
19 июня: поиск по Веб, классификация Веб страниц
26 июня: фактографический поиск
2 июля: аннотирование, новостная дорожка
28 июня 2005
В связи c обнаруженной
технической ошибкой в новостной коллекции сроки сдачи результатов по
новостной дорожке и дорожке фактографического поиска перенесены на 9 июля.
23 июня 2005
Закончен сбор результатов по дорожкам поиска по Веб коллекции, по смешанной
коллекции и по документу-образцу, а также по классификации Веб-сайтов.
15 июля 2005
Закончекн сбор результатов по дорожке фактографический поиск по новостной
коллекции. Начало оценки дорожек поиска.
1 августа 2005
Закончен сбор результатов по дорожкам аннотрирования, классификации по
нормативно-правовой коллекции.
12 августа 2005
Закончен сбор результатов по дорожкам классификации Веб-страниц и
Веб-сайтов. Начало оценки дорожек аннотрирования, классификации.
4 сентября 2005
Опубликован формат для подготовки
статей для трудов РОМИП'2005. Срок сдачи статей - 15 сентября 2004.
18 сентября 2005
Разосланы результаты оценки для 8-ми из 10 дорожек РОМИП (за
исключением дорожек по фактографическому поиску и новостной дорожки).
23 сентября 2005
Разосланы результаты по второй части дорожки фактографического поиска по
новостной коллекции (поиск фактов).
24 сентября 2005
Опубликована программа очной встречи РОМИП'2005 в
Ярославле, которая проходила совместно с конференцией RCDL'2005.
25 сентября 2005
Завершен сбор отчетов участников для включения в труды РОМИП'2005.
8 октября 2005
Опубликованы слайды очной встречи, которая
состоялась в Ярославле 6 октября. Труды РОМИП'2005 выложены в разделе публикации.
18 октября 2005
Опубликованы фотографии с очной
встречи семинара РОМИП'2005 в Ярославле.
Оргкомитет
Михаил Агеев(МГУ, Москва)
Павел Браславский (ИМаш УрО РАН, Екатеринбург)
Максим Губин (Кодекс, Санкт-Петербург)
Борис Добров (УИС РОССИЯ, Москва)
Игорь Кураленок (ПМПУ СПбГУ, Санкт-Петербург)
Игорь Некрестьянов (мат.мех СПбГУ, Санкт-Петербург)
Владимир Плешко (Гарант-Парк Интернет, Москва)
Илья Сегалович (Яндекс, Москва)
Влад Шабанов(Рамблер,Москва)
Участники
ACK
Исследовательский проект. В рамках РОМИП'2005 планируется провести апробацию
алгоритма уточнения поисковых запросов методом обратной связи по
релевантности.
В основе алгоритма лежит контекстно-ассоциативная модель текста, учитывающая
частоту совместной встречаемости различных терминов в предложениях
исследуемых
текстов (описание модели и метода уточнения запросов изложено в
статье, опубликованной в журнале "Труды МАИ",N18).
AStars
На РОМИП-2005 будет проведено тестировние нескольких алгоритмов,
разработанных исследовательской группой Института Системного Анализа РАН.
Основной упор делался на предварительную обработку текста перед
классификацией, в то время как непосредственно для классификации
использовались уже проверенные, хорошо известные алгоритмы.
Exactus
Интеллектуальная поисковая система "Exactus" является разработкой
Лаборатории Интеллектуальных Технологий и Систем ИСА РАН, а также
Исследовательского Центра Искусственного Интеллекта ИПС РАН. В системе
применяется метод семантико-синтаксического анализа, основанный на
принципах коммуникативно-грамматической школы и использующий
неоднородные семантические сети для представления фрагментов ситуаций,
описанных в тексте. Кроме того, точность и полнота поиска в системе
повышается также за счет: вычисления значимости фрагментов текста,
расширения поискового запроса синонимами и сходными по смыслу именными
группами, ввода запроса на естественном языке, возможности выбора
различных стратегий поиска (профилей поиска) и т. д. Разработка
является научно-исследовательской и доведена до стадии
исследовательского прототипа.
eXtragon
Система автоматического реферирования использует традиционные подходы для
выдел
важных предложений из текста на основе следующих параметров:
- частота встречаемости слова в тексте;
- графическое оформление слов;
- положение предложения в документе;
- "сигнальные" слова и фразы.
NNCS
Компания "Бинейро" представляет макет системы контекстно-зависимой
классификации и поиска документов по запросу - "NNСS" (Neural Network
Classification & Search). Планируется осуществить тестирование
разработанного
компанией подхода к представлению документов с использованием рекуррентных
нейронных сетей.
RCO
На РОМИП-2005 планируется провести апробацию
ряда алгоритмов, разрабатываемых исследовательской
группой бизнес-подразделения RCO компании "Гарант-Парк-Интернет".
Основное направление деятельности исследовательской группы связано с
развитием алгоритмов синтактико-семантического анализа текстов на
естественном языке. Среди прикладных задач, решаемых на базе созданных
группой алгоритмов, можно выделить построение содержательного портрета
текста, поиск упоминаний о персонах и организациях, построение
семантической сети текста, поиск и классификация фактов, оценка
тональности текста по отношению к объекту.
SearchInform
Технология поиска компании СофтИнформ позволяет осуществлять поиск
похожих
по содержанию документов в любых объемах данных. Она разработана на
основе математической модели анализа структуры документа и выбора
похожих слов, предложений и массивов текста.
Результатом поиска является вывод максимально
похожих на заданный фрагмент текста документов с указанием
процента релевантности. Также поддерживается поиск по словам
и фразам среди больших объемов неструктурированной информации.
Specs
Исследовательский проект, посвященный созданию системы
периодического тематического поиска. В рамках РОМИП-2005 будут рассмотрены
вопросы предварительной обработки текста и его представления для
классификатора, а также модификации существующих алгоритмов классификации
и алгоритмов композиции классификаторов.
WHO.Integrum
Система извлечения информации об объектах и связях между ними ФИО -
Должность - Организация (ФДО). В системе используются стандартные общие
лингвистические модули (морфологический, синтаксический и
фрагментационный анализаторы), настраиваемые модули выделения из текста
обозначений типизированных объектов (человек, организация, география и
т.п.) и их отождествления по тексту, а также модуль анализа обозначений
ситуаций, выраженных предикативной вершиной предложения и его актантами.
ДЕКОМ
Исследовательский прототип системы поиска и классификации
правовой информации.
Применяется подход на основе построения онтологии предметной области.
Золушка
Исследовательский проект, в рамках которого изучаются несколько
задач информационного поиска.
Кодекс
Полнотекстовая база данных, предназначенная для создания информационных
систем и хранилищ документов. На базе нее созданы информационно-правовый
системы "Кодекс" и "Стройэксперт", электронные системы документооборота
"Кодекс", ряд заказных систем.
Поисково-аналитическая система Галактика-Зум
Работа системы основана на составлении и анализе информационного портрета
(ИП) выборки документов. ИП представляет собой список языковых инвариантов
(слов и словосочетаний), отличающих данную выборку от прочих. ИП
используется для решения задач быстрого представления результатов запроса
без чтения текстов документов, автоклассификации и автореферирования.
Синдбад
Система классификации текстовой информации "Синдбад" представляет
собой набор утилит для структуризации и каталогизации текстовой
информации, в том числе, классификации данных, связи между которыми
невозможно представить в виде иерархической модели.
УИС РОССИЯ
Университетская информационная система РОССИЯ (www.cir.ru, УИС РОССИЯ) -
проект, нацеленный на создание информационных ресурсов для гуманитарных
исследований. Поддерживается Научно-исследовательским вычислительным
центром МГУ им.М.В.Ломоносова (НИВЦ МГУ) и АНО Центр информационных
исследований.
Для выполонений заданий РОМИП используется информационно-поисковая
система УИС РОССИЯ, к которой добавляются новые тестируемые модели и
модули.