|
Чухонцева Н. В.,
главный библиотекарь,
Отдела формирования фондов,
ГУК ГНБК им. В. Д. Федорова,
e-mail:
lingv@kemrsl.ru
|
В настоящее время эксплуатация массива информационных ресурсов невозможна без создания и распространения баз данных (далее - БД). Мир располагает множеством БД, обеспечивающих возможность многоаспектного поиска информации. БД активно применяются в библиотечно-информационном обслуживании, в создании информационных продуктов и услуг, и стратегические задачи требуют значительного повышения качественного уровня и разнообразия формируемых и используемых обществом БД.
«База данных – это совокупность относящихся к определенной области знания (теме, проблеме) взаимосвязанных данных, представленных в определенном формате на машинном носителе»[6, с.401]. Однако ни широкий потенциал вычислительной техники, ни новейшие программные средства не способны обеспечить желаемый эффект, если не решены проблемы семантической обработки информации, реализация которой невозможна без надежного лингвистического обеспечения (ЛО). Лингвистическое обеспечение автоматизированной библиотечной системы понимается как «комплекс информационно-поисковых языков (ИПЯ), а также средства и методы их создания, ведения, использования и контроля, имеющий своей целью обеспечить решение многообразных задач, стоящих перед системой»[1, с.46]. Именно лингвистические средства позволяют обеспечить предоставление как традиционных, так и создание принципиально новых информационных продуктов и услуг, обладающих высокой степенью аналитичности и интеллектуальности [2, с.713].
- Информационно-поисковые языки
- Предкоординатные ИПЯ
- Координатные ИПЯ
- Объектно-признаковый язык
- Язык библиографического описания
- Языки-идентификаторы
- Международные стандартные номера книг (ISBN), сериальных изданий (ISSN), отчетов (ISEN), музыкальных произведений (ISMN), звукозаписей (ISRC)
- Коды названий (языков, стран, физических величин)
- Таблицы авторских знаков
- Штрих-коды (документов, читателей)
- Методики индексирования
- Методики предкоординатного индексирования
- Методики координатного индексирования
- Методики фактографического индексирования
- Нормативно-справочная база
- Справочные издания
- Нормативные документы
- Средства представления данных
- Правила транслитерации знаков
- Форматы для обмена информацией
Данная структура лингвистических средств, предложенная А.Ш. Меркуловой [5], наиболее полно отражает ее содержание применительно к технологическим процессам, выполняемым в библиотеках.
Особое место среди лингвистических средств библиотечной технологии занимают языки-идентификаторы, включающие номера издательских планов, экспедиционные номера, авторские знаки, штрих-коды, международные стандартные номера (сериальных изданий, книг, музыкальных произведений), коды (языков, стран), нормативно-справочную базу, средства представления данных (правила транслитерации языков, коммуникативные форматы) [3]. Особый подход заключается в выделении языков-идентификаторов в отдельный вид лингвистических средств библиотечной технологии.
Языки-идентификаторы используются прежде всего для идентификации документов, вводимых в электронные базы данных, и идентификации пользователей.
Одними из наиболее известных и распространенных языков-идентификаторов являются международные стандартные номера книг, сериальных изданий, отчетов, музыкальных произведений, звукозаписей.
Книжный мир, построенный на опосредованном взаимодействии автора с читателем, в особенности нуждается в интеграции всех его участков. Основным признаком интеграции издательского дела и книгораспространения стало введение в качестве международного стандарта библиографического описания кода ISBN – важнейшего инструмента в области обменных форматов и связанной с ним технологией применения штрихового кодирования.
На Съезде распространителей печатной продукции, состоявшегося в 30-31 октября 1997 г., эта тема получила свое развитие. Три рабочие секции были связаны непосредственно с ISBN, штриховым кодированием и обменными форматами. С тех пор внимание к ISBN и штриховому кодированию в мире стало еще более пристальным. В ежегодных отчетах Национальных агентств приводились все более широкие формы применения ISBN в различных странах. Конкретная книга конкретного автора, изданная в конкретной стране, приобретает и международное значение, если она включена в международную систему распространения информации о книгах[4, с.18].
ISBN идентифицирует книгу независимо от времени и места издания. Он часто успешно заменяет библиографическое описание. Как уникальный код, он необходим не только в базах данных, но и в таких издательских процессах, как планирование производства, управление, хранение и сбыт изданий. Для распространителей книг ISBN незаменим в основных процессах заказов книг, расчетов за них, книгообмена и других. Он становится основой для улучшения всей инфраструктуры книжного дела, для активизации классических элементов рынка – спроса и предложения, для взаимосвязи 3 составляющих книжного сектора – издательской, книготорговой и библиотечной. ISBN многократно сократил издержки, упростил и ускорил все процессы создания и распространения книги.
Еще более значительна роль ISBN в достижении международной совместимости. Об этом свидетельствует развитие мировой системы телезаказов. Если в 1972 г. по стандарту ИСО 2108 ISBN предназначался только для книг, то в 1992-м (3-е издание этого стандарта) ISBN распространен на электронные изда¬ния, микрофильмы и т.д. Использование чужих идентификаторов сопоставимо с использованием чужого паспорта. Когда Национальное агентство присваивает издательству уникальный идентификатор, который включает в себя сведения о приблизительном количестве ежегодно выпускаемых названий книг, идентификатор и номер в целом могут принадлежать только этому издателю.
Международный стандартный номер книги (International Standard Book Number – ISBN) – буквенно-цифровой код регистрационного характера, предназна¬ченный для кодирования книжных изданий с целью их идентификации; включает аббревиатуру ISBN и, как правило, десять цифр; присваи¬вается международным и национальным агентствами ISBN по единой методике [5].
Международный стандартный номер книги является одним из признаков, идентифицирующих книгу. Номер состоит из арабских цифр от 0 до 9. Последняя цифра может быть и римской цифрой X, используемой для обозначения числа 10. ISBN состоит, как правило, из четырех групп цифр, разделенных дефисом, пробелом или иным способом и расположенных в определенной последовательности:
- идентификатор группы (служит для обозначения страны или языковой области и присваивается международным агентством – ISBN International Agency);
- идентификатор издательства или издающей организации (присваивается национальным агентством);
- порядковый номер книги (присваивается издательством или издающей организацией);
- контрольная цифра (служит для проверки правильности написания цифровой части ISBN).
Международный стандартный номер ISSN - буквенно-цифровой код регистрационного характера, предназначенный для кодирования сериальных изданий с целью их идентификации; включает аббревиатуру ИССН и, как правило, восемь цифр; присваивается ключевому заглавию сериального издания международным и национальным агентствами ИССН по единой методике и проставляется на каждом очередном выпуске, номере, томе [5].
Международные стандартные номера книг (ISBN) и сериальных изданий (ISSN) используются для обработки и поиска документов в автоматизированных базах данных. Коды названий языков и стран и штрих-коды широко применяются как для обработки и поиска документов, так и для регистрации и поиска читателей в библиотеке.
В качестве языков-идентификаторов в библиотечных базах данных могут выступать также международные стандартные номера отчетов (ISEN), музыкальных произведений (ISMN), звукозаписей (ISRC).
Международные коды стран. Существует множество разных систем кодирования стран, регионов и территорий. Какой-то общей и универсальной системы не существует, но чаще всего используются международные двухбуквенная или трехбуквенная системы, предложенные Международной Организацией по Стандартизации (ISO), в которых название страны или территории кодируют две или три буквы латинского алфавита. Эта система представлена в стандарте ISO 3166. Коды стран входят в состав штрих-кодов, проставляемых на товарах, в том числе и книгах, которые подлежат продаже.
Коды физических величин установлены Госстандартом (ныне – Росстандарт) и рекомендованы Международным союзом чистой и прикладной физики и Международной электротехнической комиссией МЭК. В обозначении физических величин используются буквы латинского и греческого алфавитов, снабженные в случае необходимости индексами. Индексы, как правило, располагаются с правой стороны внизу буквы. В качестве языков-идентификаторов в библиотечной технологии коды физических величин используются крайне мало, преимущественно в учреждениях НТИ.
Таблицы авторских знаков, или авторские таблицы, представляют собой алфавитный перечень наиболее распространенных начальных буквосочетаний, пронумерованных арабскими цифрами от 11 до 99 (в двузначных авторских таблицах) или от 111 до 999 (в трехзначных авторских таблицах). Авторские таблицы для языков народов СНГ соответствуют графике этих языков. Предназначены для определения авторского знака. В России впервые такие таблицы составлены Л.Б. Хавкиной.
Авторские таблицы широко применяются как в общедоступных, так и в научных библиотеках России для расстановки фонда и каталожных карточек в алфавитном порядке. Их использование облегчает труд работников фондохранилищ, значительно ускоряет подбор и обратную расстановку литературы, дает возможность помещать вновь поступающие издания на строго определенное для них место.
Авторский знак - условное обозначение фамилии автора или первого слова заглавия документа в алфавитном порядке. Авторский знак включает начальную букву фамилии автора или заглавия документа и число, определяемое авторскими таблицами, которое состоит из двух цифр.
Так, для определения авторского знака книги под заглавием «В любое время» достаточно одной буквы, составляющей первое слово заглавия, – "В". Для определе¬ния авторского знака слова «Сборы» необходимы две первые буквы, слова «Талант» – три, а довольно распространенной фамилии «Иванов» – шесть. Однако во всех случаях автор¬ский знак будет состоять из первой буквы и только двух цифр, т. е., применительно представленным выше примерам, соответственно В11, C23, Т16, И20.
Сочетания начальных букв первых слов заголовка описания располагаются в таблице в строгой алфавитной последовательности. Это позволяет при расстановке книг руководствоваться только возрастающим порядком букв и номеров в них.
Вместе с классификационным индексом авторский знак составляет шифр книги или шифр описания. Формализация сведений о каждом документе, составляющем библиотечный фонд, позволяет максимально упростить процесс расстановки книг и карточек в каталогах. В перспективе она, возможно, позволит поручить нахождение и простановку авторских знаков автоматизированным системам. Нахождение авторского знака по единым для всех библиотек таблицам приводит к унификации данной операции.
Штриховой код (штрих-код, бар-код) - способ кодирования информации с помощью комбинации наносимых типографическим способом параллельных штриховых линий различной толщины с различным расстоянием между ними. Считывается специальным оптическим устройством – сканером. В библиотеке используется для регистрации и учета поступающих книг, журналов и других видов документов, а также для учета используемой пользователями литературы.
Штрихкодирование документов и пользователей библиотек является одной их составляющих работы с электронным каталогом.
Для библиотечных автоматизированных систем специальных государственных стандартов на штрих-коды нет. Однако во многих зарубежных библиотеках используют стандартные штрих-коды при автоматизированном контроле за выданными книгами через абонементные службы, при автоматической регистрации книг и абонентов. При этом отдается предпочтение алфавитно-цифровым штрих-кодам, например, стандарту Intermec CODE-39 (библиотеки Сингапура), который позволяет кодировать буквенные знаки и легко считывается самыми различными системами считывания.
Потребность в штриховом кодировании особенно ощутима в абонементной системе библиотеки. Выполнение ручным способом таких процедур, как идентификация пользователей и выявление несанкционированных лиц, пытающихся получить библиотечные документы, идентификация задержек возврата книг, запись на очередь на получение книги, выявление возврата книги и др. очень трудоемко. Чем больше вводится контрольных элементов, тем более трудоемкой становится система. Штриховое кодирование обычно вводится при довольно высоком уровне компьютеризации библиотеки.
Итак, использование лингвистических средств в базах данных зависит от функций библиотек, направлений деятельности, целей технологических процессов, особенностей практики. Эффективное использование лингвистических средств, в том числе и языков-идентификаторов, является необходимым условием создания качественной поисковой системы.
Литература
1. Гендина Н.И. Лингвистические средства автоматизации документального поиска / Н.И. Гендина; под ред. В.П. Леонова. – СПб.: БАН, 1992. – 188с.
2. Гендина Н.И. Лингвистические средства информационно-библиотечной технологии в структуре профессиональной подготовки специалистов информационно-библиотечного профиля / Н.И. Гендина, И. Л. Скипор // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. - М., 2000. - Т. 2. - С.713-715.
3. Меркулова А.Ш. Функциональный анализ лингвистических средств библиотечной технологии (на примере областных библиотек разных типов): дис. на соиск. учен. степ. канд. пед. наук: 05.25.03 / А.Ш. Меркулова. – Кемерово, 2005. – 236 с.
4. Смурова Н. ISBN, штриховые коды, электронный обмен данными – приметы времени / Н. Смурова // Читающая Россия. – 1998. - №1. – С.18-22.
5. Современная каталогизационная терминология: толковый словарь с методич. рекомендации / РГБ; сост. Т.А. Бехтурина, Э.Р. Сукиасян. – М.: РГБ, 1992. – 197с.
6. Справочник библиографа / науч. ред. А.Н. Ванеев, В.А. Минкин. – 2-е изд, перераб. и доп. – СПб.: Профессия, 2003. – 559с.