Корпоративная поисковая система
AskNet
Search Corporate
AskNet Search Corporate -
интеллектуальная информационно-поисковая система, предназначенная для точного и
быстрого поиска неструктурированной текстовой информации в многопользовательском
режиме на компьютерах корпоративной вычислительной сети.
Работа системы основана на базовых алгоритмических решениях технологии AskNet,
адаптированных к особенностям их применения для индексации и эффективного поиска
неструктурированной семантически связанной текстовой информации в корпоративной
сети. Система имеет развитые средства администрирования доступом пользователей к
поисковым сервисам и информационным ресурсам корпоративной сети, планирования
загрузки вычислительных ресурсов, настройки лингвистической подсистемы
AskNet Liguist.
Основные функциональные возможности:
-
обработка поисковых запросов
пользователей на естественных русском или английском языках, а также
запросов, содержащих смешанные фрагменты русских и английских текстов, при
необходимости - с уточнением запроса в диалоговом режиме;
-
синтаксико-семантический
поиск информации для текстов на русском или английском языках с учетом
синонимов ключевых слов, содержащихся в вопросе, и родственных им слов;
-
полнотекстовый точный поиск
информации по ключевым словам на русском и/или английском языках с учетом
морфологии;
-
поиск информации по любым
последовательностям цифр и букв - аббревиатурам, именам собственным и т.д.,
а также по всем возможным вариантам написания слов и чисел;
-
автоматическая интегральная
оценка семантического соответствия найденной проиндексированной текстовой
информации смысловому содержанию вопросов пользователей;
-
возможность просмотра
найденных предложений, абзацев, а также оригиналов найденных документов с
сохранением их исходного форматирования и позиционированием текста;
-
выделение цветом найденных
слов, совпадающих со словами запроса пользователя, подсветка слов
семантического ответа системы;
-
адаптация системы к новым
словам из любой предметной области за счет автоматического словообразования
всех морфоформ незнакомых слов;
-
администрирование процессов
индексации и поиска, обеспечение отказоустойчивости, управление
конфигурацией поискового кластера и загрузкой вычислительных ресурсов.
-
возможность настройки,
пополнения и корректировки словарной подсистемы посредством модуля ведения
лингвистических средств.
Форматы и кодировки:
-
Документы форматов Microsoft
Office (doc, dot, rtf, wri, xls, pps, ppt, pot), html (htm, mht) и pdf, txt;
текстовые поля mp3 файлов; zip-, rar, arj-архивы и самораспаковывающиеся
файлы (exe) этих архивов, почтовые архивы Microsoft Outlook.
-
Кодировка текстовых файлов:
Windows-1251, 1252; Unicode UTF-16, UTF-8, UTF-7; KOI-8r; txt-866;
ISO-8859-5; Mac.
Скорость индексации текста –
примерно 1,5 Мбайт в минуту.
Время выполнения поискового запроса
- в среднем 3 секунды.
Количество создаваемых баз
проиндексированных документов в корпоративной сети – неограниченное.
В качестве зон индексации допускается указывать как папки и файлы серверов сети,
так и общие сетевые ресурсы компьютеров.
Примечание: по желанию
заказчиков могут быть реализованы дополнительные требования к поисковой системе,
определяемые особенностями ее конкретного применения.
Комплект поставки
Покупатель AskNet Search Corporate получает диск, содержащий инсталлятор,
устанавливающий на компьютеры серверов индексирующий и поисковый модуль, включая
лингвистический процессор, словарную подсистему, модуль ведения лингвистических
средств, СУБД проиндексированных текстов, сетевой сервер, индексатор (включая
поисковый робот - "паук"), модуль поиска, подсистему администрирования, а на
компьютеры пользователей – программное обеспечение клиента.
Покупатель программно-аппаратного комплекса семантического поиска и аналитической обработки неструктурированной текствой информации получает заранее настроенный и готовый к применению
в составе корпоративной вычислительной сети предприятия компьютер, с установленным программным обеспечением AskNet Search Corporate.
Требования к аппаратному и программному
обеспечению:
- операционная система серверов:
корпоративный сервер -
Microsoft Windows NT Server
/ 2000Server
/ 2003Server
с установленным
Internet Information Server;
компьютеров администратора и поисковых серверов
(служб) - Microsoft Windows
NT / 2000 /
XP;
- операционная система пользователей: Windows 98/ME/2000/2000Server/XP/2003Server
с браузером Internet Explorer 5.5 и выше;
- компьютеры серверов с производительностью процессора не ниже Intel Pentium 4 с
рабочей частотой 3 ГГц; объем ОЗУ не менее 1 Гб; свободное место на HDD
(желательно HDD RAID SCSI) не менее 1 Гб для системных файлов; наличие CD или
DVD привода; сетевое оборудование;
- компьютеры пользователей с производительностью процессора не ниже Celeron с
рабочей частотой 300 МГц; объем ОЗУ не менее 512 Мб; сетевое оборудование.
|