порядку рубрику ГРНТИ, к которой она отнесена на этапе предметизации;
выделяем
соответствующий фрагмент онтологии для этой рубрики; осуществляем подготовку текста публикации и фрагмента онтологии для индексирования (переводим в текстовый формат, удаляем из текста слова, не несущие смысловую нагрузку);
3. последовательно сравниваем слова текста публикации с терминами выделенного фрагмента онтологии (включая синонимы терминов) и формируем совокупность терминов онтологии, входящих в текст публикации.
В результате индексации массива публикаций формируется база
индексов, которая используется для поиска данных по запросам.
Индекс представляет собой ряд строк (ветвей таксономии), начиная с названия рубрики (корня) и включая все термины таксономии вплоть до найденного термина
на этапе индексации - для каждой публикации и рубрики ГРНТИ осуществляем следующие действия: