Некоторые рассуждения о соотношении традиционных и электронных каталогов.

Миниярова Залина Михайловна,
Центральная городская библиотека
им. К.Маркса, г.Новосибирск

Стройная структура библиографической записи и системы библиотечных каталогов складывалась веками, и в итоге мы получили систему, оптимальным образом представляющую библиографическую информацию и обеспечивающую её поиск. (К системе каталогов в виде АК, СК с АПУ, ПК следует добавить инвентарную книгу и топокаталог).

Каждый каталог сортирует записи по определённому признаку (алфавит формальных или тематических заголовков, инвентарные номера и т.п.). Внутри каждой каталога так же существует набор признаков, по которому можно найти запись, набор этот ограничен по количеству признаков для одного документа.

Библиографическая запись приняла вид и наполнение, оптимальным образом позволяющий выполнять основные функции БЗ - общее представление об описываемом документе, его идентификация и поиск.

Номенклатура каталогов, поисковых признаков, элементов описания и правила вырабатывались веками, и их развитие привело к достижению некоего компромисса между объёмом и сложностью системы с одной стороны и набором задач, которые должны быть решены с другой стороны. Эта оптимальность имеет место в традиционной среде, для которой она и достигнута. Среда эта имеет свои методы работы с информацией, свои возможности организации поиска и т.п., то есть, диктует свои законы.

Электронный же каталог - это прежде всего компьютерная база данных. Термин каталог используется главным образом потому, что содержимым базы данных являются сведения о документах. Хотя ныне базы данных нередко трактуются в широком смысле как электронные картотеки, что тоже, конечно, верно, но только как философское обобщение. Для компьютерной БД характерны другие методы организации, структурирования, а главное - оперирования информацией.

По сути, ЭК - это иной вид/способ/метод представления информации о документе и раскрытия фонда.

Вы можете возразить и будете во многом правы. Ведь эта новая система имеет дело со специфической задачей - раскрытие фондов и идентификация документов. И она (эта новая система) никак не может, не имеет права игнорировать сложившуюся стройную, оптимальную теорию и практику описания документов.

Итак, можно говорить о соотношении двух систем, которые преследую одну цель, каждая во многом своими средствами.
Внутренний формат представления информации в БД, формат БД, может быть любой, в зависимости от конкретной СУБД и воли разработчиков.

Но при этом мы должны иметь возможность получить БО и БЗ в полном соответствии с ГОСТом. Это необходимо и для ведения традиционных карточных каталогов, для использования БЗ в печатных списках и указателях, кроме того, БО является оптимальным вариантом представления библиографической информации, к которому привыкли пользователи.

Обращаю ваше внимание, что библиографическая запись - это выходной продукт по отношению к электронному каталогу. Я бы даже не стала определять ЭК как базу данных, содержащую библиографические записи.

* * *

В первую очередь размерами каталогов и трудоёмкостью процесса каталогизации было рождено правило о создании авторского заголовка при наличии не более трёх авторов. Список обязательных и рекомендованных к отражению в ответственности и в добавочных записях типов ответственных лиц тоже не слишком широк и ограничен количественно.

Очень часто на практике встаёт вопрос: сколько авторов вводить в электронный каталог? Отражать ли там то или иное лицо, если оно упомянуто не на титульном листе и даже не на его обороте?

Ответ однозначный - вводить всё, что есть возможности ввести. Проблема объёма ЭК стоит не так остро, как в карточном каталоге, трудоёмкость тоже снижается за счёт того, что нет необходимости расставлять добавочные карточки. Нужно только ввести эту фамилию в ЭК.

Можно утверждать, что в ЭК ограничение библиографической информации об описываемом документе традиционными рамками не имеет смысла и вредно. Это напоминает стрельбу из пушки по воробьям, когда не используется заложенный в ЭК огромный потенциал.

Вот что говорили по этому поводу ещё в 1968 году:

"При использовании традиционных библиотечно-библиографических средств информационного поиска - каталогов, картотек и указателей - обычно приходится ограничивать число авторов, имена которых служат характеристиками для поиска документов. Необходимость в таком ограничении отпадает, когда информационный поиск ведётся при помощи машин. Это даёт возможность отражать в описании не только имена авторов, но и имена других лиц, участвующих в создании документа" [6, с. 178].

Это говорят люди, являющиеся не столько библиотекарями, сколько информационными работниками. Именно с позиций профессионального владения понятиями информации и информационных систем они и рассуждают. Нам надо только решить - используем мы электронный каталог как способ для печати карточек и просто как замену традиционным каталогам, или мы хотим иметь качественно новый инструмент.

Но с другой стороны, можно и возразить на такой подход.

А если авторов сто? Вводить всех? Где-то есть граница? И где? Кто её укажет?

Плюс к этому, как любой библиотечный работник, я вправе спросить, почему это я должна вводить всех этих 25 авторов, если мне за это не платят. Всевозможные нормы (даже на ввод записей в ЭК) созданы из расчёта ведения традиционной системы каталогов и связанного с ней объёма необходимой библиографической информации.

Поэтому необходимо решать такие две задачи.
______1) Разработка ГОСТов, положений, норм и руководств именно для электронных каталогов, а не просто механический перенос понятия традиционной среды на электронную.
На сегодняшний же момент нередко может помочь такой подход. Если встаёт вопрос, делать что-то или не делать, соблюдать какое-то правило или нет, нужно попытаться проанализировать, в результате каких причин данное правило появилось. Если эти причины не продолжают действовать в электронной среде, то правило соблюдать не надо. Если продолжают в той или иной мере, то соблюдать правило по возможности в степени, пропорциональной этой мере.
______2) Создание национального и/или регионального центров вырабатывающих полную библиографическую информацию.
Вопросы дублирования работы по составлению библиографических записей на одни и те же документы во множестве библиотек хоть как-то пытаются решать через корпоративную каталогизацию, но вопросы создания и распространения максимально информативных описаний не решаются никак. Даже РНБ выдаёт записи Русмарка в объёме, строго совпадающем с требованиями традиционной системы (США - описание документа занимает несколько часов, а это возможно лишь при централизованной каталогизации).

Ещё один момент, рождённый практикой. Именно специалисты-практики, каталогизаторы, работающие с ЭК, нередко приходят к тому, что стараются как можно меньше сокращать слова. В конце концов, мы работаем с базой данных и хотим читать содержимое, искать в ней - сокращения тут совершенно не нужны. И нас, в общем-то, не должно интересовать, что именно некий ГОСТ трактует в отношении традиционных библиографических записей и каталогов.

Ибо это разные вещи - электронный и традиционные каталоги. С другой стороны, последние никто не отменял, как никто не отменял и другие формы использования печатных библиографических записей. Как же быть? Непонятно.

Оптимальным, но на сегодняшний день идеалистическим, был бы выход, когда программа сама, при формировании выходной формы, сокращала бы слова, используя для этого какой-нибудь внутренний словарь. Лично я о существовании подобных сервисов в АИБС пока не слышала.

* * *

Вопросы соотношения традиционного описания и электронного проявятся и в случае, если мы обратимся к коммуникативным форматам (MARC-форматы).

Когда года 3-4 назад появился российский коммуникативный формат Русмарк, раздавались голоса, утверждающие, что Русмарк должен быть принят как обязательный формат для всех электронных каталогов. Причём, скорее всего, подразумевалось, что именно как внутренний формат хранения.

Конечно, утверждение неверное, но возникло оно не на пустом месте. Сейчас ситуация с выходными формами в АИБС несколько улучшилась, а лет 7-10 назад положение было плачевным. Мало какая программа могла изобразить нормальную каталожную карточку, построить правильную библиографическую запись. Даже АИБС, якобы основывающиеся на коммуникативном формате (главным образом USMARC), страдали ограничениями, вызванными линейной структурой их форматов (вместо гибкого чередования подполей). Эти ограничения приводили к невозможности построения адекватной библиографической записи (к примеру, в области выходных данных).

Поэтому вполне естественно, что накопилось огромное желание получить-таки от этой груды железа нормальное описание, только коммуникативный формат сам по себе тут ни при чём.

У информации, содержащейся в ЭК, есть своя внутренняя логика и структура, что, следовательно, должно находить отражение в структуре формата БД и процедурах, эти данные обрабатывающих и интерпретирующих. И эта самая внутренняя логика и есть то общее, что есть между форматом БД и коммуникативными форматами, а источник этой общности - традиционное методы представления библиографической информации, оптимальным образом отражающие логику представления информации о документе.

А уж каким образом БД выполняет предъявляемые требования, следует правилам этой логики - с помощью какого внутреннего формата, каких внутренних процедур - это дело частное, касающееся конкретной АИБС. Главное, чтобы результат - получение выходных форм в виде библиографических записей, соответствующих ГОСТу - был налицо.
Если с отношением коммуникативного формата и формата хранения определились, неплохо бы разобраться, что же такое коммуникативный формат, что содержит его запись, чем же и между чем мы обмениваемся.

Считается, что с помощью коммуникативного формата мы обмениваемся БЗ в машиночитаемой форме. То есть фактически каталожными карточками, которые может как-то воспринять компьютер. Каталожные карточки нужны для карточного каталога. Мы же вроде бы работаем с электронным. Значит, мы обмениваемся между базами данных. А зачем для базы данных каталожная карточка, пусть и машиночитаемая? Наверное, мы всё же обмениваемся записями базы данных?

Двойственность статуса коммуникативного формата - запись ли это базы данных или библиографическая запись - двойственность субъектов обмена можно проследить на истории развития коммуникативных форматов. Развитие, которое движется от формата библиографической записи к формату записи базы данных. Это движение часто идет на пользу, но нередко идёт во вред чистоте представления именно библиографической записи.

* * *

Если в части библиографического описания существуют более-менее однозначные критерии, то в отношении индексирования таких критериев нет. Даже в традиционной предметизации существуют различные методики.

Вообще говоря, никто не может дать четкий и однозначный ответ, как же индексировать документы в электронном каталоге и как строить поисковую стратегию. Даже если какая-либо библиотека за десятилетие ведения ЭК и выработала, наконец, подход, методику, которая её вполне устраивает, это не означает, что данная методика может быть объявлена как единственно верная или даже просто как верная. Непременно найдутся специалисты и/или ситуации, которые выявят изъяны. А распространить эту методику на все ЭК нельзя по определению. Так как различные АИБС могут поддерживать разную структуру представления терминов индексирования, разные поисковые возможности и разные способы построения запросов.

А ведь эти три фактора как раз во многом и определяют конкретную методику.

(Примеры различий. Есть иерархия рубрик или её нет; конечная иерархия или бесконечная; разные поля для рубрик и ключевых слов или нет; наличие внешнего словаря; ряд рубрик один, или их несколько; термин ищется в начале поля, в любом месте и т.п.; есть ли возможность управления этими параметрами при составлении запроса или такой возможности нет; есть ли возможность искать на полное совпадение или нет; есть ли возможность строить комбинированные запросы и насколько удобен интерфейс такого построения и т.п.)

[Хочу поделиться результатами наблюдения за ЭК различных библиотек, библиотек разных систем и расположенных в различных городах. Источники сведения - публикации, каталоги в Интернете и собственный опыт работы в различных библиотеках.

Распространённые подходы:
1. В поле Предметная Рубрика заносится: формулировка предмета, темы, рассматриваемого в документе.
______Подрубрика - аспект, форма издания.
______Поле Ключевые слова - слова из названия и содержания.
______При этом в рекомендациях по поиску даются указания по интерпретации:
______КС - узкий аспект темы.
______ПР - отраслевая направленность.
______Методика заполнения не всегда будет соответствовать методике поиска.

2. Предметные Рубрики создаются на основе АПУ к СК.
Поле Ключевые Слова носит вспомогательный характер, заполняется, когда не хватает средств других языков для полного выражения содержания. Вносятся узкие конечные предметы (Word, пентальгин и т.п.). Источник - название и текст документа.

Подход к КС похож на 1, кроме вспомогательного характера. В таком случае при поиске нужна чёткая инструкция, сообщающая об особенностях наполнения поля КС.
Во всех этих случаях необходимо знать, в каком именно поле что искать, а также нужно применять булеву алгебру.

3. Предметные рубрики формируются не только на основе АПУ, но и с использованием формулировок делений таблицы ББК. Поисковый ряд единый.
Возможен выход из списка рубрик на иерархию таблицы.

4. КС используются в соответствии со стандартным определением из терминологического ГОСТа 7.74-96:
"КС - это информативное слово, приведённое к стандартной лексикографической форме и используемое для координатного индексирования".

5.ПР не используются.
Поле КС содержит в себе и собственно ПР, и КС.

6.КС не используются (сознательно или АИБС на поддерживает такой элемент данных)
______а) ПР на основе общей теории предметизации.
______б) Поле ПР содержат в себе и ПР, и КС, и элементы классификационной иерархии.

Обращает на себя внимание и тот факт, что практически все каталоги имеют несколько (до 5) различных поисковых языков, которые редко представляют единую поисковую систему. Утверждается даже, что это не только хорошо, но и необходимо, так как эти языки дополняют друг друга. Но реально существенными дополняющими друг друга языками могут быть только вербальные и формальные, предметные и классификационные. Разновидности же этих языков, присутствующие в одной системе, только усложняют поисковую стратегию. Если это всё приемлемо, привычно и удобно для профессионального пользователя, то для неподготовленного может только усложнить работу, или даже, при использовании конкретного языка, исключить из рассмотрения ряд документов.

Желательно иметь интегрированную систему, объединяющую различные подходы к индексированию и поиску.
Другой аспект наблюдений.

В прессе можно встретить два почти противоположных утверждения:
______- у пользователей востребован только вербальный поиск.
______- читатели любят работать с классификационной структурой и хорошо воспринимают индексы классификаций.
Самое интересное, что оба утверждения делаются на основе специальных исследований.

Бесспорно, имеет место факт, что пользователи часто предпочитают языки вербального типа, предъявляют такие основные требования к поиску в ЭК, как доступность, простота, оперативность. С другой стороны, нельзя лишать пользователей возможности вдумчивого поиска, рассмотрения классификационной структуры и базы знаний. К тому же пользователь бывает разный. Информационный посредник должен обладать универсальным инструментом и методикой поиска в ЭК.]

Повторю ещё раз, что ЭК - это иной способ представления библиографической информации, во многом отличающийся от традиционной системы. Общее между ними обусловлено внутренними особенностями, закономерностями самой библиографической информации, которой эти две системы оперируют.

Отличия связаны главным образом различными механизмами оперирования информацией и различиями в организации поисковых функций.

Если эти различия не всегда находят адекватное отражение в методах ведения электронного каталога в той его части, которая связана с библиографическим описанием и формальными заголовками, то в части, касающейся раскрытия содержания описываемого документа эти различия порою и вовсе не учитываются. Чаще всего имеет место механическое "изображение" в электронной среде традиционных поисковых механизмов. Тем не менее, нужно говорить о машиноприменяемом индексировании, которое организует поиск именно в электронной среде.

[Когда мы говорим об индексировании в электронном каталоге, то практически всегда говорим о предметизации (как бы вольно это понятие ни трактовалось (см. примеры выше)).

Систематизация же практически исключается из поискового механизма ЭК, хотя в публикациях нередко отмечается необходимость иметь возможность и предметного поиска и систематического. В данном случае я не имею в виду индексы ББК или УДК как таковые (об этом ниже), я имею в виду "организованную систему знаний", "базу знаний", которую представляют собой таблицы систематизации и систематический каталог.

Могу привести обширные цитаты из Э.Р. Сукиасяна, который убедительно показывает, что лишать читателя подобного инструмента в корне неправильно, но не буду занимать на это время. Инструмент в виде машиночитаемого СК необходим не только читателям, а всем пользователям, в том числе и профессиональным библиотечным работникам. Систематизация и предметизация, СК и ПК самостоятельно не могут решить всех поисковых задач, они дополняют друг друга.

По словам Э.Р. Сукиасяна, "Россия - единственная страна в мире, где ставится вопрос о предпочтении одного вида поиска другому. Во всех других странах вместо "или" говорят "и", так как различные виды поиска не являются альтернативными, а дополняют друг друга".

В российских библиотеках нередко вставал вопрос "систематический или предметный каталог?" только потому, что многие библиотеки не могли себе позволить вести оба. В случае работы с электронной базой данных, каковой является электронный каталог, ведение двух рядов, использующих разные принципы индексирования, не встречает таких принципиальных препятствий, как ведение двух карточных каталогов (я, конечно же, не хочу этим сказать, что объём работы по индексированию уменьшается).

Реализация описанных выше подходов, конечно, требует создания специальной системы, разработки удобного интерфейса. Но уже сейчас, используя стандартные средства распространённых АИБС, можно при желании строить элементы такой системы.

Моделирование и ПК, и СК с АПУ в электронном каталоге не является единственным способом организации тематического поиска.

Считается, что для машинного поиска наиболее подходящими являются посткоординатные языки. Если предкоординатные языки строят свои классы до процесса индексирования, то посткоординатные языки, строя свои классы из имён простых классов, образуют необходимые понятия в момент индексирования и/или поиска документов.

К посткоординатным языкам относят посткоординатные фасетные классификации и языки дескрипторного типа. На самом деле, даже посткоординатные фасетные классификации не дадут нам возможности координировать понятия при поиске, если они не имеют механизма поиска путём пересечения своих составляющих.

Принцип координатного индексирования предполагает для характеристики содержания документа или запроса выбор таких ключевых слов или дескрипторов, пересечение которых выражает тему документа или запроса. То есть мы имеем дело с координацией понятий.

Что нам это может дать?

Многое. В частности, отсутствует зависимость от грамматики (иногда такой подход так и называют "индексирование без грамматики"), понижается зависимость от конкретной словесной формулировки, то есть несколько снижаются ограничения вербальных ИПЯ.

Оперируя именами простых классов как кубиками, мы каждый раз получаем новый класс, нужный в данный момент, а заранее не существующий. Один и тот же "кубик" используется для выражения разных понятий и аспектов. Таким образом, мы имеем дело с посткоординатным языком.

Существует несколько трактовок понятия координатного индексирования, которые, если и не противоречат друг другу, то и не совпадают. Я же в этом материале трактую координатное индексирование именно с точки зрения принципа пересечения понятий, их координации. И рассматривать координацию можно не только в отношении вербального выражения этих понятий, но и формального.

С известной долей истины я отнесу к посткоординатным языкам любую фасетную классификацию. А примеры буду приводить только для ББК.

ББК представляет собой комбинационную классификационную систему. Классификационный индекс строится из структурных элементов, в совокупности адекватно и многоаспектно раскрывающих содержание документа.

[По комбинационным свойствам ББК значительно опережает Десятичную классификацию Дьюи и Классификацию Библиотеки Конгресса. По этому параметру, а также по семантической мощности (объему понятий), система сопоставима с Универсальной десятичной классификацией. Некоторые разделы ББК построены по фасетному принципу. Система типовых делений за последние десятилетия значительно расширилась. ББК постепенно превращается в глубоко детализированную аналитико-синтетическую классификацию. Концепция такого развития разработана много лет назад, но практическая реализация задержалась, так как в 90-х гг. коллективу разработчиков пришлось решать первоочередные задачи деидеологизации системы [18].

Классификационный индекс ББК может практически адекватно отразить содержание документа, раскрыв до 25-30 поисковых признаков. Большинство из них выражается собственным опознавательным знаком или символом.
"Систематизатор может скомбинировать индекс со многими элементами, отражающими массу поисковых признаков. Но в каталоге используется лишь начальная левая часть индекса, середина и окончание просто не принимаются во внимание." (Сукиасян Э.Р.)

Таким образом, поисковые возможности индекса чрезвычайно ограничены. Самое интересное, что и в электронных каталогах мы чаще всего наблюдаем простой перенос традиционного поискового механизма в электронную среду. Подобный подход даже позволил ещё несколько десятилетий назад сделать выводы о неэффективности использования классификационных систем для машинного поиска.

Естественное решение, позволяющее многократно повысить поисковые возможности индекса, а также проводить в широких пределах комбинирование понятий при поиске - это создание формата, с определённой степенью адекватности выражающего структуру индекса.

Элемент индекса кодируется собственным идентификатором, и таким образом индекс не воспринимается машиной как последовательность цифр и знаков, а расчленяется на части, каждая из которых становится отдельным поисковым признаком. Автоматизированный поиск может вестись как по отдельным значащим элементам классификационного индекса, так и по их сочетаниям с использованием булевой алгебры. Словом, возможны действия такие же, как и со всеми элементами библиографического описания, идентифицированными в электронном каталоге.

Именно такой подход позволяет нам проводить комбинирование понятий при поиске, применять "индексирование без грамматики", ограниченным набором терминов раскрывать содержание с достаточной глубиной.

За рубежом данное направление считается сейчас наиболее перспективным.

Специалисты пришли к выводу, что расширение поисковых возможностей OPAC будет происходить за счёт машиночитаемых классификационных данных в диалоговом режиме, в первую очередь фасетных классификаций. [3, 12].
Уже разработана система кодирования классификационных индексов и их элементов в машиночитаемых форматах семейства MARC. В нашей стране в РНБ коллектив под руководством В.В.Скворцова ведёт работу по созданию Классификационного формата Русмарк. Будем надеяться, что в обозримом будущем мы сможем познакомиться с результатами их труда.

В нашей стране работы в направлении организации систематического поиска велись в ГБЛ коллективом под руководством В.Ю. Невраева в первой половине 1970-х годов. Были найдены способы поэлементного индексирования при обработке поискового образа документа и отдельно - поискового образа запроса. В частности, Владимиром Алексеевичем Мишиным была разработана система идентификаторов для элементов индексов УДК на основе разрабатываемого в те годы в ГПНТБ СССР так называемого предмашинного формата. В.А.Мишин также определил перспективы поиска информации в автоматизированных системах в соответствии с элементами классификационных индексов. Работы по данному направлению были законсервированы в силу всевозможных организационных причин, поэтому широкого распространения подобная практика не получила.

Традиционно в ГПНТБ России ведутся активные работы в направлении совершенствования лингвистического обеспечения АИБС. В последние несколько лет разработаны интерфейсы представления классификаций, предназначенные и индексаторам, и читателям и предоставляющие навигацию по словарям, возможность работы и с классификационным деревом, и с отдельными элементами индекса, с последующей сборкой элементов в полный индекс. Сложно делать выводы на основе только публикаций, однако представляется, что на сегодняшний день это лучший отечественный продукт в данной области. Применяется этот интерфейс для УДК, однако считается универсальным. [16]. Интересно выяснить, есть ли опыты его приложения к ББК.

Но и, не дожидаясь появления специальных программных продуктов, можно пытаться работать с поэлементным поиском.
Например, была построена упрощенная модель на базе АИБС "Библиотека 4.02".

Модель строилась на основе ББК для массовых библиотек. Это издание вполне обозримо и подходит для упрощенной модели. Для каждой отдельной таблицы, присутствующей в данном издании, будь то ОТД, СТД или ТТД, были выделены отдельные элементы, то есть заведены отдельные подполя. А именно подполя для ОД, ТТД, ОТД, СТД техники, СТД территории, СТД в экономике и СТД в частном языкознании. Конечно, такое построение (на каждую таблицу своё подполе) не является правильным, однако вполне годится для целей моделирования.

Так называемые внешние словари (терминология данной АИБС) в случае необходимости строились по иерархическому принципу (например, для ОД); словарь для СТД техники включал два плана (у каждого отдельная ветвь дерева); словарь для СТД для ТТД включал ветви для делений по административно-территориальному признаку и по физико-географическому признаку. Словари включали сам индекс, его словесную формулировку и, по мере необходимости и возможности, методические указания. Первые два признака являются поисковыми внутри словаря, то есть имеется возможность и вербального и формального поиска необходимого термина индексирования.

В ЭК был внесён тестовый массив описаний, примеры взяты из каталогов нашей библиотеки и ГПНТБ СО РАН.
В результате, на основе только использования индекса ББК и комбинирования в запросе различных его элементов можно было получить ответы на множество разнообразных вопросов.

Найти записи каталога о документах по* :
______Международная библиография, вся - "ОД=78.54 and TTD=0"
______Международное сотрудничество в сфере библиографии - "ОД=78.54 and ОTD=ж"
______и не лекции - " ОД=78.54 and ОTD=ж and ОТД не=я73 "
______Отечественная библиография - "ОД=78.54 and TTD=2"

______История зарубежной библиографии - "ОД=78.54 and ТTD=0 and ОТД =г "
______История Великобритании - "ОД=78.54 and TTD=4Вел"
______Учебники по истории Европы - "ОД=78.54 and TTD=4# and ОТД =я7 "
______точное совпадение в ттд
______* Учебники по истории любой страны Европы - "ОД=78.54 and TTD=4 and ОТД =я7 "
______в ттд все начинающиеся с 4

Примеры взяты из реального каталога, в котором присутствуют различные индексы ББК, присвоенные в разные годы и даже десятилетия. Этим объясняются возможные устаревшие на сегодняшний день решения в индексах.

Последние два примера показывают использование различных параметров поиска. Запрос * в традиционном каталоге можно выполнить только перебором нескольких разделов. А при использовании языка предметных рубрик в ЭК в каждой записи должна присутствовать рубрика с указанием страны, запрос должен содержать перечисление всех рубрик для всех стран.

При традиционном на сегодняшний день для ЭК подходе, в каждой записи должны присутствовать соответствующие словесно сформулированные рубрики. В данном случае и множество рубрик отсутствует, нет зависимости от грамматики в их формулировках.

Примеры с эргономикой из реального АПУ (ГПНТБ СО РАН):
______Эргономика 30.17
______Эргономика авиационная 39.52-021.7
______Эргономика автомобилей 39.33-021.17
______Эргономика автомобильных дорог 39.311-022.17
______Эргономика подвижного состава 39.22-021.7

Эти записи занесены в импровизированный АПУ. Он работает только как справочник, без реального перехода к разделам СК, хотя можно было проставить данную рубрику в БЗ и таким образом осуществить вход.
Посмотрели АПУ, перешли к нужным БЗ (автоматически, или с помощью последующего ручного поиска).

А если я хочу получить эргономику вообще во всём транспорте? Возможен вариант запроса "ОД=39 and СТД Техники=021.7"

В этом случае мы найдем много, но не всё. Например, про автомобильные дороги записи пропускаются. Железнодорожные пути тоже будут иметь свой индекс. Хотя в АПУ такой рубрики и не было; может, книг нет, а может, так мало, что не завели рубрику АПУ.

Таким образом, даже АПУ не всегда раскроет нам нужные индексы, и этих индексов несколько.

Но когда во всех записях ЭК было поставлено ещё по одному ОД с 30.17, что в принципе неправильно по традиционной методике, проблема была решена. Запросом "ОД=39 and ОД=30.17" мы "пересекаем" два простых понятия и получаем новое понятие "эргономика на транспорте".

При этом в записях ЭК всего лишь в определённом поле стоит "30.17".

Это вовсе не означает, что данной БЗ (а здесь именно библиографическая запись!) присвоен индекс, например, 39.22-021.7 + 30.17, или присвоен индекс 39.22-021.7: 30.17, или индекс 39.22 + 30.17, или 39.22: 30.17.

Нет, это просто значения полей записи базы данных.

Как из этих кубиков собрать правильный индекс для карточного каталога - это уже другая задача, вполне решаемая, надо только выяснить, какой же именно индекс для карточного каталога хочет получить систематизатор.

Другой, более интересный вопрос. Если я хочу получить "чистую эргономику", без привкуса отрасли, то есть собственно раздел СК 30.17, то возникают проблемы. На запрос "ОД=30.17" вывалится абсолютно всё.

Это задача перекликается с первыми тремя режимами поиска по Мишину. И, конечно, она решается. Главное - получить возможность отфильтровать записи с чистой эргономикой от отраслевых.

С этой целью в построенной модели в записи по "чистой" эргономике вводился просто индекс "30.17" в поле для ОД, а в "отраслевых записях", то есть там, где в полном индексе присутствуют другие элементы, где по смыслу данный элемент применяется в целях сочетания с другими элементами, - там применялось некое подобие индикатора, а именно внесено "30.17:"
______
Таким образом,
______- запрос "ОД=30.17" выдаёт всю эргономику, этот вариант применяется для комбинирования в составном запросе.
______- запрос "ОД=30.17#" выдаёт только "чистую" эргономику, только раздел СК "30.17"

В рамках программы "Библиотека 4.02" # означает поиск на полное совпадение, без усечения справа. Именно благодаря наличию этого поискового режима оказалось возможным построить данную модель поэлементного поиска.

Итак, во-первых, индекс был структурирован, для уточнения значения отдельных терминов использованы индикаторы, а сами термины индексирования, то есть элементы индекса ББК, вводились не в соответствии с традиционной методикой систематизации по ББК, а исходя из задач организации поиска именно в ЭК. Если ещё добавить необходимость более полного выражения индексами ББК содержания документа, а не присвоения индекса только с целью определить его место в СК (можно даже использовать для этой цели другой поле), то можно говорить именно о системе машиноприменяемого индексирования.

Конечно, описанная модель всего лишь одна из возможных и носит иллюстративный характер. Но и на этом примере видно, какое разнообразие запросов можно реализовать на основании использования поэлементного кодирования систематического индекса и учета всех поисковых возможностей электронной среды.

Литература

1. Библиотечно-библиографическая классификация: современное состояние, перспективы развития (Научный семинар в РГБ)// Библиотековедение. - 2001. - № 3.
2. Возможности тематического поиска в электронном каталоге ГПНТБ СО РАН /Жарикова Л.А., Скарук Г.А., Бобко А.В., Сергеева Г.И. //Научные и технические библиотеки. - 2000. - № 8. - С. 30-38.
3. Загорская, Е.И. Возможности и перспективы использования ББК в качестве ИПЯ и средства организации системы доступа в электронной среде/ / Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Тема 2001 г.: Производители и пользователи электронной информации на пути к информационному обществу: Труды конференции. / 8-я Международная конференция "Крым 2001". - М.: ГПНТБ России, 2001. - Т. 1.
4. Ильина, Р.Б. Структурный анализ ББК (Опыт работы) // Проблемы внедрения Библиотечно-библиографической классификации: Сб. науч. тр. / Гос. б-ка СССР им. В.И.Ленина. - М., 1974. - Вып. 2. - С. 6-13.
5. Лавренова, О.А. Средства обеспечения поисковых функций электронных каталогов в Российской государственной библиотеке [Электронный ресурс] / О.А. Лавренова, В.А. Беляев // Сайт РГБ. - Способ доступа: URL: http://www.rsl.ru/STAT98/ST1_CONT.HTM
6. Михайлов, А.И. Основы информатики / А.И.Михайлов, А.И.Черный, Р.С.Гиляревский. - 2-е изд, перераб. и дополн. - М.: Наука, 1968.
7. Мишин, В.А. Возможности машинного поиска информации по классификационным индексам // Организация систематических и предметных каталогов научных библиотек: Сб. науч. тр. / Гос. б-ка СССР им. В.И.Ленина. - Вып. 2. - М.,1976. - С. 49-55.
8.Мишин, В.А. Интегрированный ИПЯ универсальной автоматизированной ИПС/ В.А. Мишин, Л. Санчес-Мехидо // Советское библиотековедение. - 1976. - № 5. - С. 59-68.
9. Мишин, В.А. Реляторы и возможность их применения в ББК // Проблемы внедрения Библиотечно-библиографической классификации: Сб. науч. тр. / Гос. б-ка СССР им. В.И.Ленина. - М., 1974. - Вып. 2. - С.46.
10. Ранганатан, Ш.Р. Классификация двоеточием. Основная классификация / Пер. с англ., под ред. Т.С.Гололицкой, Х.М.Зайдберга, П.И.Шифмана; [ГПНТБ СССР]. - М., 1970. - 422 с.
11. Ролофф, Генрих. Новые средства каталогизации. От фасетной классификации к дескриптору и тезаурусу / Пер. с нем., предисл., примеч., Р.С.Гиляревского. - М.: Книга, 1980. - 56 с.
12. Сукиасян, Э.Р. Библиотечные каталоги: Методические материалы. - М.: Профиздат, 2001. - 92 с. - (Современная библиотека; Вып. 19)
13. Сукиасян, Э.Р. Памяти Мишина (1918-1999) // Научные и технические библиотеки. - 2000. - № 7. - С. 79-84.
14. Сукиасян, Э.Р. Электронный каталог и читатель (Послесловие к статье Г.С.Щербининой "Философия координатного индексирования") // Научные и технические библиотеки. - 2000. - № 9. - С. 79-85.
15. Сухманева, Е.Г. К методике фасетизации ББК: (На примере раздела "В6 Астрономия") / Сухманева Е.Г., Суслов А.К. // Проблемы внедрения Библиотечно-библиографической классификации: Сб. науч. тр. / Гос. б-ка СССР им. В.И.Ленина. - М., 1974. - Вып. 2. - С. 14-45.
16. Универсальный интерфейс представления классификационных баз данных на примере базы данных УДК/ Маршак Б.И., Зайцева Е.М., Фуралев О.А., Сбойчаков К.О. // Научные и технические библиотеки. - 2000. - № 3. - С. 57-60
17. Щербинина, Г.С. Философия координатного индексирования. //Научные и технические библиотеки. - 2000. - № 9. - С. 67-78.
18. E.R. Sukiasyan. Homo Quaerens (The seeking man): On the problem of development of the reader's cognitive capacities in the searching process // Cognitive paradigms in knowledge organization: 2nd Intern. ISKO Conference, Madras, 26-28 Aug., 1992. - Madras, 1992. - P. 15-22.

 

<Назад>____________<Вперед>____________<Содержание>____________<На главную>