ML Классификатор 2.0
ML Классификатор - система с обучением на образцах, использует метод
различительных сил и полнотекстовый поиск. При выделении признаков
применяется выделение словосочетаний статистическим методом, или при помощи
поверхностного синтаксического анализа. Полнотекстовый поиск таких
словочетаний в процессе классификации позволяет соблюсти баланс между
полнотой, характерной для систем классификации, использующих однословные
термины, и точностью, которой отличаются системы со словосочетаниями.
mnogoSearch
Полнофункциональная поисковая система для сайта или группы сайтов.
RCO
В дорожках планируется использовать модули входящие в состав продуктов, а также используемые в
проектной деятельности компании "Гарант-Парк-Интернет", связанной с построением
информационно-поисковых и информационно-аналитических систем. К базовым технологиям, развиваемым
исследовательской группой компании, относятся морфологический анализ, синтактико-семантический
анализ, тематическая классификация, фактографический поиск.
Sophia
Исследовательский прототип системы классификации, разработанный совместно
факультетом прикладной математики - процессов управления С. Петербургского
государственного университета и лабораторией инженерии знаний (NIKEL)
университета Ольстера ( University of Ulster, UK).
Золушка
Исследовательский прототип системы классификации Веб ресурсов.
ИС "Кодекс"
Полнотекстовая база данных, предназначенная для создания информационных
систем и хранилищ документов. На базе нее созданы информационно-правовый
системы "Кодекс" и "Стройэксперт", электронные системы документооборота
"Кодекс", ряд заказных систем.
Ментал
Система Ментал использует синтаксический словарь проф.
В.А. Тузова и семантический описатель собственной разработки.
С текстами произвольной тематики использует гибридный
поиск, основанный на средневзвешенном значении соответствия
по словам и семантическому значению.
С текстами известной тематики использует семантико-логическую
модель предметной области (состоящую из описания типов объектов
и правил зависимостей) и логический интерпретатор для поиска соответствия.
Поисково-аналитическая система "Галактика-Zoom" Работа системы основана на составлении и анализе информационного портрета (ИП) выборки
документов. ИП представляет собой список языковых инвариантов (слов и словосочетаний), отличающих
данную выборку от прочих. ИП используется для решения задач быстрого представления результатов
запроса без чтения текстов документов, автоклассификации и автореферирования.
Синдбад
Система классификации текстовой информации "Синдбад" вляется частью
общего пакета верификации данных, разработанного в Бюро Интернет
Технологий, и представляет собой набор утилит для структуризации и
каталогизации текстовой информации, выявления ошибок при отсутствии
количественных ограничений на сложность структуры связей, типы данных
и их объем.
Рубрикация осуществляется по набору ключевых слов, связанных
отношениями булевой логики с применением частотных словарей и
возможностей нечеткого поиска для выявления связей, возникающих между
элементами информации за счет совпадения или близости фрагментов
исследуемого текста, в т.ч. связей, которые невозможно представить в
виде иерархической модели. Помимо контекстной зависимости, для более
точной рубрикации используется смысловая близость уже
отрубрицированных элементов.
Система применима для работы с реляционными, иерархическими, сетевыми
БД, а также со слабоструктурированными данными: Web-ресурсами,
системами документооборота, текстовыми файлами.
УИС РОССИЯ (НИВЦ МГУ + АНО ЦИИ)
В РОМИП 2004 планируется опробовать некоторые технологии,
реализованные в составе
информационно-поисковой системы "Университетской информационной
системы РОССИЯ"
(УИС РОССИЯ, http://www.cir.ru), либо планируемые к реализации.
Информационно-поисковая система УИС РОССИЯ поддерживается совместно
лабораторией
анализа информационных ресурсов Научно-исследовательского
вычислительного центра МГУ
(информационные технологии) и АНО Центр информационных исследований
(лингвистические ресурсы
и технологии).
УИС РОССИЯ представляет собой программно-аппаратное решение
организации коллекции в миллион
документов, ориентированное на потребности аналитических служб
(использование рубрикаторов,
тезауруса, он-лайн анализ результатов запроса, интерактивное
уточнение запроса и т.п.)
Яндекс.Server 3.2
Полнотекстовое индексирование и поиск с учетом русской морфологии
Ты как думаешь? Конечно здесь чистка террариума выполняется настоящими профессионалами.