Лингвистическое обеспечение российских электронных каталогов: тенденции, проблемы, решения


Скарук Галина Анатольевна

старший научный сотрудник
Государственная публичная научно-техническая библиотека СО РАН

Качество лингвистического обеспечения (ЛО) электронных каталогов (ЭК), как и качество его использования во многом определяют востребованность библиотечных фондов и качество библиотечного сервиса. За рубежом ЛО ЭК активно преобразуется в условиях автоматизации, меняются методы цели его применения. В докладе сопоставляются тенденции развития и использования лингвистического обеспечения ЭК в России и за рубежом. Основные направления в этой области характеризует следующие перечень: некоторое противостояние между развитием ЭК нового поколения как систем, принимающих запросы на естественном языке, и ЭК, функционирующих на основе традиционных контролируемых ИПЯ (ведущее к стремлению создать модели индексирования и поиска, комбинирующие методы традиционных контролируемых ИПЯ с возможностями формального представления знаний); появление естественно-языковых интерфейсов; активное внедрение методов и технологий, применяемых в поисковых машинах Интернета и коммерческих веб-сервисах, в социальных сетях (технологии Web 2.0); развитие лингвистических инструментов межязыкового поиска информации; обеспечение связей и интеграции между различными поисковыми языками; попытки как можно более полного выявления и визуализации связей и отношений между лексическими единицами ИПЯ (например, технологии связанных данных); разработка функциональных требований к авторитетным данным и форматов их представления, максимально пригодных для поиска в Интернете; совместное создание и применение авторитетных данных; автоматическое создание электронных словарей ИПЯ; реализация функционирования предкоординатных ИПЯ в посткоординатном режиме; направленность на обогащение содержания библиографических записей и поисковых предписаний как автоматическими методами, так и вручную (использование тезаурусов, авторитетных файлов, «электронных таблиц» и т. п.; фолксономия, присоединение к БЗ аннотаций, оглавлений, отзывов читателей и пр.). Далее отмечаются основные проблемы и вызовы, стоящие перед создателями и пользователями ЛО ЭК. В части создания ЛО для российских каталогов обозначены такая проблема, как неоправданно широкое применение в ЭК языка ключевых слов. Этот вид индексирования наименее затратен для индексаторов, однако серьезно затрудняет поиск для пользователей каталогов. Осложняет ситуацию отсутствие в России современных версий машиночитаемых словарей практически всех ИПЯ, пригодных для предоставления в распоряжение читателей и использования как единых средств индексирования в корпоративных системах. В качестве причин сложившейся ситуации прежде всего можно назвать недостаточность финансовых и кадровых ресурсов для создания подобных систем, порожденную недостаточным осознанием важности проблем всеми участниками создания ЭК. Поскольку проблемы не решается уже на протяжении многих лет, можно предположить, что ее осознание должно произойти на государственном уровне. Авторитетные файлы поисковых языков должны оцениваться как национальные информационные ресурсы, подобные системе авторитетных файлов Библиотеки Конгресса США. К сожалению, на наш взгляд, библиотечная общественность, увлеченная идеями поиска «как в Интернете», недостаточно использует здесь свое влияние. В части использования ЛО в России самой существенной была и остается проблема недоиспользования возможностей автоматизации при индексировании. В отечественных ЭК невозможен доступ к БЗ через авторитетные файлы ИПЯ, то есть они практически не используются как поисковые инструменты. Не обеспечен эффективный поиск по классификационным индексам, обладающих уникальными поисковыми возможностями, которых нет ни у одного вербального ИПЯ. В ЭК не реализуется интеграция между различными языковыми средствами, не внедрены методы обогащения содержания поисковых образов документов и запросов. Серьезной проблемой и у нас, и за рубежом остается недостаточная подготовленность пользователей к самостоятельной работе с лингвистически и средствами поиска в ЭК . Для ее решения разработан ряд разнообразных инструментов. Можно выделить четыре общих направления: помощь в освоении и реализации поисковых навыков, помощь в создании поисковых предписаний, помощь в их корректировке, помощь в отборе пертинентных документов в выданном в ответ на запрос массиве БЗ. Но их внедрение в российских ЭК – дело будущего.