b5ab525c

Технические подробности


В Серверном Следопыте реализована технология динамического индексирования информации, что позволяет часто обновлять содержимое сервера. Быстрое пополнение индекса по заданному графику не мешает поиску и сразу же делает новые документы доступными для поиска. Следопыт одинаково эффективно производит индексирование и поиск по документам на русском и английском языке, при этом все слова запроса находятся во всех возможных грамматических формах. Система устойчива к высокой нагрузке и позволяет обрабатывать десятки тысяч поисковых запросов в сутки, что проверено клиентами компании на практике.

Механизм обработки запроса на естественном языке не только облегчит пользователю задачу формулировки поискового запроса, но позволит найти документы, соответствующие смыслу, и не содержащие в точности слова поискового запроса. Например, по запросу “морские глубины” будут найдены документы содержащие “глубина моря” и “глубокие моря”. Краткая содержательная аннотация, передающая смысл найденного документа, позволит пользователю оценить содержание найденного текста, не обращаясь к оригиналу. Следопыт подсвечивает в тексте документа слова запроса, что дает пользователю возможность сразу обратить внимание на нужные части документа. Переход между найденными документами и вхождениями слов запроса в тексте можно осуществлять с помощью удобной системы стрелок.


На стадии подготовки мастер диска используется генератор индексной базы и автоматических аннотаций. Настройки поисковой формы и шаблона отчета производится путем редактирования HTML форм. На мастер-диске размещаются: база HTML текстов, индексная база, аннотации и клиентский комплект MegaXS CD Searcher.

Ядром клиентского комплекта MegaXS CD Searcher является поисковый агент. Он вычисляет запросы по индексной базе и извлекает аннотации к найденным документам. Поисковый агент не имеет собственного пользовательского интерфейса и общается с Web- браузером посредством ActiveX модулей.

Когда пользователь нажимает кнопку Поиск, его запрос принимается ActiveX модулем получения запроса и передается для вычисления поисковому агенту. Далее из списка формируется отчет о найденных файлах, который передается для загрузки в браузер.

Важно отметить, что данная реализация не требует от пользовательского компьютера какого-либо сетевого протокола или DCOM и единственным требованием для успешного функционирования системы является наличие Internet Explorer.




Классификатор предназначен для структурирования больших массивов информации без использования ручного труда, путем определения принадлежности входящих документов к заранее созданным рубрикам.

Главными чертами системы являются: полная автоматизация процессов обработки, сортировки, а также возможность поддержки индивидуальных настроек для каждого пользователя системы.



Содержание раздела