Подсистема словарей
и лингвистические категории AskNet Search
Морфология AskNet
Search
Количественная
характеристика |
Английская база
|
Русская база
|
Количество основ
(нарицательные) |
92 998 |
161 763 |
Количество основ
(собственные) |
36 730 |
78 515 |
Количество словоформ |
214 000 |
7 200 000 |
Количество уникальных
окончаний слов |
693 |
7 711 |
Количество моделей
словоизменения |
736 |
2 665 |
Количество классов
синонимов |
33 026 |
12 310 |
Количество синонимов (число
пар) |
106 334 |
51 723 |
Число неповторяющихся основ
синонимов |
15 000 |
22 500 |
Комбинаторный словарь
нарицательные и собственные |
16 502 |
13 000 |
Синтаксический словарь
|
11 400 |
15 480 |
Семантический словарь
(слов и комбинаций) |
43 100 |
87 300 |
Примечание. В таблице приведены
значения на март 2007 г.
Подсистема словарей и
лингвистических категорий постоянно совершенствуется.
Синтаксис AskNet
Search
Число синтаксических категорий,
учитываемых при анализе запроса - 200, текста - 30.
Семантика AskNet
Search
Число учитываемых семантических
категорий - 77.
Число иерархических уровней в
категории - 4.
Реализованный с системе набор из 77
семантических категорий, является достаточным для описания семантики текста при
поиске ответа на вопрос.
Подсистема словарей и
лингвистические категории системы AskNet
Search могут быть
дополнены и настроены для конкретной предметной области на основе использования
модуля ведения лингвистических средств AskNet Linguist.
|
|