Опубликована информация о ПЕРВОЙ Российской летней школе по
информационному поиску - RuSSIR,
которая успешно прошла в Екатеринбурге в сентябре 2007 года.
10 апреля 2006
Опубликован новый контактный адрес оргкомитета - romip[AT]romip.ru.
Опубликованы правила проведения дорожек поиска и
классификации, включая форматы данных и результатов. Начало
распространения заданий для них.
25 июня 2007
Опубликованы правила проведения дорожек поиска по
документу образцу, кластеризации новостного потока и контекстно-зависимого
аннотирования, включая форматы данных и результатов.
20 сентября 2007
Разосланы результаты оценки для дорожки поиска по нормативно-правовой
коллекции.
25 сентября 2007
Разосланы результаты оценки для дорожек поиска по Веб коллекции и смешанной
коллекции.
1 октября 2007
Разосланы результаты оценки для дорожек классификации Веб-сайтов и
Веб-страниц.
10 октября 2007
Публикация трудов РОМИП'2007 отложена из-за задержек с проведением оценки.
18 октября 2006
В Переславле-Залесском состоялась очная часть РОМИП'2007, на которой были
представлены 6 докладов. После закрытия официальной части семинара и RCDL по традиции
состоялся неформальный круглый стол. Заметки с круглого стола
опубликованы в форуме.
Exactus
Exactus - система семантического поиска и анализа текстовой информации
в гетерогенных информационных ресурсах и сервисах. Exactus - это
научно-исследовательский проект, который развивается в Институте
Системного Анализа РАН в течении последних 5 лет командой опытных
лингвистов, программистов, математиков и психологов.
Новая версия Exactus успешно сочетает в себе статистические и
лингвистические методы анализа текстов и функицонирует на
высокопроизводительной кластерной установке под управлением
операционной системы Unix. Exactus представляет поисковый сервисы
естественно-языкового поиска, вопросно-ответного поиска, расширения
запроса близкими по смыслу словами из Тезауруса, персональной
онтологии пользователя и много другое.
NearSky
Система обнаружения закономерностей в больших объемах данных. NearSky
обладает возможностями для проведения эффективного поиска, формирования
прогнозов и классификации текстов в предопределнные категории. В основе
системы лежит метод приближенного вычисления оценок вероятностей событий.
RCO
Компания RCO специализируется на исследованиях в области компьютерной
лингвистики и создании компонентов интеллектуального анализа текста
для информационно-поисковых и информационно-аналитических систем. На
семинаре планируется провести апробацию ряда алгоритмов тематической
классификации документов и структуризации новостного потока.
SOPHIA
SOPHIA (SOPHisticated Information Analysis)- это система поиска, в основе
которой лежит алгоритм, кластеризации Contextual Document Clustering (CDC).
Алгоритм CDC выделяет из множества документов в коллекции узкие по смыслу
контексты (кластеры).
SPECS
Исследовательский проект, посвященный созданию системы
периодического тематического поиска в Web.
Yandex
Версия поисковой системы 3.8.2 beta.
Версия новостного агрегатора 2.1
Галактика-Zoom
Система обработки больших объемов неструктурированных данных Галактика-Zoom
-
инструмент для создания хранилища текстовой информации, который обладает
возможностями для проведения эффективного поиска и аналитических
исследований. Галактика-Zoom обеспечивает поиск в информационных массивах с
применением языка запросов; возможен контекстный или тематический поиск
информации с
учетом морфологии. С помощью комплекса Галактика-Zoom можно построить
информационный образ объекта исследования (Информационный портрет) на
основе языковых конструкций - слов и словосочетаний.
Зеркало новостей
Cистема предназначена для автоматического формирования выпусков
новостей, собираемых от различных источников.
В основе алгоритмов кластерного анализа и реферирования лежит подход,
основанный на использовании абзацев в качестве единицы текста.
Поиск KM.ru
KM.ru на РОМИП-2007 планирует провести апробацию новой поисковой
системы, реализующей функции классического информационного поиска. В
основе системы - традиционные алгоритмы и собственные разработки.
Университетская информационная система РОССИЯ (УИС РОССИЯ) - проект, нацеленный на
интеграцию информационных ресурсов для гуманитарных исследований.
Поддерживается Научно-исследовательским вычислительным центром МГУ
им.М.В.Ломоносова (НИВЦ МГУ) и АНО Центр информационных исследований (АНО
ЦИИ).
Решения на основе технологий УИС РОССИЯ - тематический анализ текстов,
классификация по большим рубрикаторам, интерактивный поиск документов -
используются в некоторых органах государственной власти и управления,
коммерческих организациях.