Оптимизация поиска в электронных библиотеках на основе инфлюентного анализа


Рахматуллаев Марат Алимович

Профессор, преподаватель кафедры "ИНФОРМАЦИОННО-БИБЛИОТЕЧНЫЕ СИСТЕМЫ "
Ташкентский университет информационных технологий

21 век привнес в инструментарий поиска информации не только блага в виде передовых технологий доступа к электронным ресурсам, но и невиданный доселе огромный объем данных, из которых необходимо находить нужные знания. В настоящее время одним из важных аспектов информационного поиска стало не столько формирование самих источников, сколько оптимизация поиска в огромном пространстве информационной среды. Соответственно затрудняется поиск искомой информации, отвечающей запросам пользователей. Проблема сужения области поиска – наиболее важна в электронных библиотеках научно-образовательной информации, т.к. требуется оперативность и достоверность данных для научных исследований и технологических решений. В статье рассмотрен подход к сужению объема информации на основе методов инфлюентного анализа и нечеткой логики для повышения эффективности поиска данных из электронных библиотек. Основная часть. В теории детерминированного инфлюентного анализа введено понятие инфлюенты – как оценки влияния изменения входных параметров на изменения выходных параметров в системах управления. Хотя теория рассчитана в основном на производственные и экономические объекты, но основные принципы можно использовать и в технологиях информационного поиска. При поиске информации различные показатели влияют на результаты по разному, «цена» в каждом случае неодинакова. Например, если вам нужны лишь научные достижения по той или иной области, наиболее существенным фактором является поиск в научной информационной среде, в научных журналах с высоким показателем импакт-фактор и др. Но если вас интересуют лишь применение научного результата например, в бизнес проектах, то область исследований будет уже другой. На практике бывает трудно определить, нашли вы искомую информацию или нет, т.е. насколько точно она соответствует не только вашим требованиям, но и требованиям времени. Поэтому использование как самих критериев поиска, так и их степени влияния очень важно при нахождении искомой информации. Количественная оценка уровня влияния (инфлюентов) критериев очень трудно поддается формализации. Для инфлюентного анализа в процессе поиска информации необходимо нахождение инфлюент Ax как оценок влияния изменений объема подобласти поиска на объем выводимых данных. При поиске информации необходимо выделить те критерии, которые в той или иной степени отражают поисковые образы и «отсекают» информационные слои, которые не соответствуют запросу или соответствуют не существенно. Выделим эти критерии: R - Поисковый образ (ключевые слова, автор и др.); P - Профессия пользователя (его интересы, область исследований и др.) K - Уровень квалификации (школьник, студент(бакалавр или магистрант), докторант, преподаватель, доцент, профессор и др.); S - Социальный статус (безработный, работающий и т.д.) Т- Цель поиска (бизнес, научные исследования, преподавание и др.) Эти критерии в той или иной степени влияют на процесс нахождения источника информации. Формирование запросов происходит на основе применения оценок с использованием методов нечетких множеств, экспертного опроса и инфлюентного анализа, которые позволяют выделить наиболее важные показатели для поиска и «отсечь» ненужные области данных. Они могут сыграть существенную роль при сокращении области поиска информации в электронных библиотеках. Заключение. Исследования проводятся на базе Ташкентского университета информационных технологий для разработки новых программных комплексов информационно-библиотечной системы ARMAT+ для корпоративной информационной сети библиотек вузов Узбекистана. Использование методов инфлюентного анализа и нечеткой логики позволяют существенно сократить объем поиска за счет отсекания массивов данных неадекватных запросу.