ACK
Исследовательский проект. В рамках РОМИП'2005 планируется провести апробацию
алгоритма уточнения поисковых запросов методом обратной связи по
релевантности.
В основе алгоритма лежит контекстно-ассоциативная модель текста, учитывающая
частоту совместной встречаемости различных терминов в предложениях
исследуемых
текстов (описание модели и метода уточнения запросов изложено в
статье, опубликованной в журнале "Труды МАИ",N18).
AStars
На РОМИП-2005 будет проведено тестировние нескольких алгоритмов,
разработанных исследовательской группой Института Системного Анализа РАН.
Основной упор делался на предварительную обработку текста перед
классификацией, в то время как непосредственно для классификации
использовались уже проверенные, хорошо известные алгоритмы.
Exactus
Интеллектуальная поисковая система "Exactus" является разработкой
Лаборатории Интеллектуальных Технологий и Систем ИСА РАН, а также
Исследовательского Центра Искусственного Интеллекта ИПС РАН. В системе
применяется метод семантико-синтаксического анализа, основанный на
принципах коммуникативно-грамматической школы и использующий
неоднородные семантические сети для представления фрагментов ситуаций,
описанных в тексте. Кроме того, точность и полнота поиска в системе
повышается также за счет: вычисления значимости фрагментов текста,
расширения поискового запроса синонимами и сходными по смыслу именными
группами, ввода запроса на естественном языке, возможности выбора
различных стратегий поиска (профилей поиска) и т. д. Разработка
является научно-исследовательской и доведена до стадии
исследовательского прототипа.
eXtragon
Система автоматического реферирования использует традиционные подходы для
выдел
важных предложений из текста на основе следующих параметров:
- частота встречаемости слова в тексте;
- графическое оформление слов;
- положение предложения в документе;
- "сигнальные" слова и фразы.
NNCS
Компания "Бинейро" представляет макет системы контекстно-зависимой
классификации и поиска документов по запросу - "NNСS" (Neural Network
Classification & Search). Планируется осуществить тестирование
разработанного
компанией подхода к представлению документов с использованием рекуррентных
нейронных сетей.
RCO
На РОМИП-2005 планируется провести апробацию
ряда алгоритмов, разрабатываемых исследовательской
группой бизнес-подразделения RCO компании "Гарант-Парк-Интернет".
Основное направление деятельности исследовательской группы связано с
развитием алгоритмов синтактико-семантического анализа текстов на
естественном языке. Среди прикладных задач, решаемых на базе созданных
группой алгоритмов, можно выделить построение содержательного портрета
текста, поиск упоминаний о персонах и организациях, построение
семантической сети текста, поиск и классификация фактов, оценка
тональности текста по отношению к объекту.
SearchInform
Технология поиска компании СофтИнформ позволяет осуществлять поиск
похожих
по содержанию документов в любых объемах данных. Она разработана на
основе математической модели анализа структуры документа и выбора
похожих слов, предложений и массивов текста.
Результатом поиска является вывод максимально
похожих на заданный фрагмент текста документов с указанием
процента релевантности. Также поддерживается поиск по словам
и фразам среди больших объемов неструктурированной информации.
Specs
Исследовательский проект, посвященный созданию системы
периодического тематического поиска. В рамках РОМИП-2005 будут рассмотрены
вопросы предварительной обработки текста и его представления для
классификатора, а также модификации существующих алгоритмов классификации
и алгоритмов композиции классификаторов.
WHO.Integrum
Система извлечения информации об объектах и связях между ними ФИО -
Должность - Организация (ФДО). В системе используются стандартные общие
лингвистические модули (морфологический, синтаксический и
фрагментационный анализаторы), настраиваемые модули выделения из текста
обозначений типизированных объектов (человек, организация, география и
т.п.) и их отождествления по тексту, а также модуль анализа обозначений
ситуаций, выраженных предикативной вершиной предложения и его актантами.
ДЕКОМ
Исследовательский прототип системы поиска и классификации
правовой информации.
Применяется подход на основе построения онтологии предметной области.
Золушка
Исследовательский проект, в рамках которого изучаются несколько
задач информационного поиска.
Кодекс
Полнотекстовая база данных, предназначенная для создания информационных
систем и хранилищ документов. На базе нее созданы информационно-правовый
системы "Кодекс" и "Стройэксперт", электронные системы документооборота
"Кодекс", ряд заказных систем.
Поисково-аналитическая система Галактика-Зум
Работа системы основана на составлении и анализе информационного портрета
(ИП) выборки документов. ИП представляет собой список языковых инвариантов
(слов и словосочетаний), отличающих данную выборку от прочих. ИП
используется для решения задач быстрого представления результатов запроса
без чтения текстов документов, автоклассификации и автореферирования.
Синдбад
Система классификации текстовой информации "Синдбад" представляет
собой набор утилит для структуризации и каталогизации текстовой
информации, в том числе, классификации данных, связи между которыми
невозможно представить в виде иерархической модели.
УИС РОССИЯ
Университетская информационная система РОССИЯ (www.cir.ru, УИС РОССИЯ) -
проект, нацеленный на создание информационных ресурсов для гуманитарных
исследований. Поддерживается Научно-исследовательским вычислительным
центром МГУ им.М.В.Ломоносова (НИВЦ МГУ) и АНО Центр информационных
исследований.
Для выполонений заданий РОМИП используется информационно-поисковая
система УИС РОССИЯ, к которой добавляются новые тестируемые модели и
модули.