Приложение

Инструкция по индексированию документов
(формированию ключевых слов в ЭК)

Введение

Качество индексирования документов т.е. описание и содержание средствами ИП (информационно-поискового языка), требует полноты отображения в поисковых образах документа (ПОД) всех важных аспектов их содержания и точного соответствия содержания документа значениям лексических единиц (ЛЕ).

Составление и написание ключевых слов (КС) при вводе и индексировании библиографической записи (БЗ) состоит из нескольких этапов:
1. этап - анализ заглавия, продолжения заглавия, аннотации, реферата к книге или статье, оглавления, а в наиболее ответственных случаях и выборочных участков текста (введения, выводов и т.п.)
2. этап- формирование ключевых слов (КС)

Формирование ключевых слов

В качестве КС используются отдельные слова и словосочетания, аббревиатуры, фрагменты сложных слов, соединенных дефисом (социально - экономический), числа и даты, вводимые по методике, изложенной ниже:
_______- одиночное существительное вводится в форме именительного падежа и, как правило, в единственном числе (ввод понятий во множественном числе оговорен в инструкции ниже)
_______- одиночное прилагательное и причастие вводятся в единственном числе, именительном падеже, в мужском роде (экономический, политический). Но в ЛЕ - словосочетаниях прилагательное согласуется с существительным.
_______ _______Например: одиночное прилагательное - ценный
_______ _______ _______ЛЕ - словосочетание - ценная бумага
_______- наречие заменяется на соответствующее прилагательное (автоматически - автоматический)
_______- деепричастие преобразуется в соответствующее существительное (поставляя - поставка)
_______- глагол вводится в виде отглагольного существительного (преобразуют -преобразование)
_______- омонимы (слова, имеющие одинаковое произношение и написание)
_______ _______Например: карта игральная и географическая. В таких случаях следует кроме омонима вводить дополнительное КС, уточняющее его смысл: Карта + Игральный, Карта + Географический
_______- синонимы: Желательно избегать применения синонимов и использовать для этого отсылку см. Если при формировании КС предпочтение отдано одному из 2-х понятий-синонимов, то к выбранному в качестве КС понятию ставится отсылка см. от синонима, который в качестве КС решено не использовать.
_______ _______Например: из 2-х синонимов Суицид и. Самоубийство предпочтение отдано понятию Самоубийство. При введении первой записи, в которой будет впервые сформулировано КС Самоубийство, следует ввести также КС - отсылку от неиспользуемого при последующих вводах синонима - Суицид см. Самоубийство. Данное КС - отсылка будет помещено в списке КС один раз и при последующих вводах будет отсылать оператора к выбранному синониму - КС Самоубийство, за которым и следует собирать все последующие записи на данную тему.

При этом на введенную отсылку необходимо составить рукописную карточку для картотеки методических решений с последующим однократным введением текста отсылки в списки ключевых слов остальных видов записей (т.е., текст отсылки таким образом будет отражен во всех четырех видах изданий в КНИГАХ, ГАЗЕТАХ, ЖУРНАЛАХ и РЕЦЕНЗИЯХ) базы КС в Картотеке статей (и аналогично в базах данных ГК и Краеведение ЭК), и при последующих вводах будет информировать оператора о выбранном для ввода варианте, что позволит избежать дублирования однотипных понятий-синонимов в базах КС.

Следует иметь в виду, что есть Синонимы, в применении которых есть нюансы, определяющие выбор то одного, то второго из двух понятий-синонимов, как наиболее соответствующего тематике индексируемого материала, В этом случае следует применять тот синоним, который точнее определяет содержание материала.
_______Например: понятие Учитель, как правило, могло бы быть синонимом понятия Педагог, а понятие Педагог имеет более широкий смысл. И при индексировании материалов о педагогах вузов применять КС Учитель нецелесообразно.
Или: понятие Персонал могло бы применяться в материалах о кадрах предприятия (тем более, что связка Персонал предприятия стала часто применяющейся), но, например, в материалах о занятости кадров определенных профессий (библиотечных, научных и т.д.) понятие Персонал применяется гораздо реже, чем понятие Кадры.

В таких случаях следует применять то понятие (одно из двух), которое точнее определяет содержание индексируемого материала. При этом следует принять методическое решение об однократном введении в базу Ключевых Слов связывающих ссылок см. также от первого понятия ко второму и от второго понятия к первому. Решение оформляется соответствующей рукописной карточкой для картотеки методических решений. Введение таких связывающих ссылок проводится однократно в каждую из соответствующих баз КС. Такая связывающая ссылка будет информировать пользователей о наличии соответствующих материалов, собираемых за другим КС - синонимом, и позволит избежать дублирования одних и тех же БЗ в двух местах базы КС.

Во множественном числе вводятся следующие понятия:
_______- слова, не имеющие единственного числа (сани, очки, ножницы, джинсы и т.п.)
_______- наименования биологических видов, отрядов, классов, семейств и т.д. (кошачьи, косточковые). Но наименования определенного животного или растения вводятся в единственном числе (кошка, лев, слон, яблоня)
_______- наименования наций и народностей (кельты, скифы, русские, татары)
_______- наименования групп людей, объединенных по следующим признакам: религиозному, политическому, географическому, сословному, по принадлежности к направлению искусства (азиаты, христиане, шестидесятники, демократы, символисты)

Исключение в формулировке таких наименований составляют исторически сложившиеся названия: аристократия, дворянство, духовенство, казачество, крестьянство, купечество.

Материалы персонального характера о каком-либо деятеле, принадлежащем к вышеперечисленным группам, следует индексировать КС, сформулированным в единственном числе: политик, путешественник, купец, аристократ, демократ (для более точного разделения материалов персонального характера и материалов о соответствующих группах, нациях, народностях).

Исключение составляют наименования профессий, которые вводятся в единственном числе (адвокат, библиотекарь, экономист) и когда речь идет о профессии в целом, и при индексировании материалов персонального характера о представителях данной профессии. Если наименование профессии состоит из нескольких слов, то КС вводится в виде ЛЕ - словосочетания с дополнительным вводом отдельных понятий из словосочетания, имеющих поисковое значение, в качестве самостоятельных КС.
_______Например: наименование профессии - мойщик посуды. Следует вводить два КС - Мойщик посуды и Посуда

Следует также различать отдельные понятия, меняющие смысловой оттенок при смене множественного числа на единственное число:
_______отходы (утиль, мусор) - отход (отступление, действие)
_______чтения (мероприятие)- чтение (процесс, действие)
_______курсы (способ обучения) - курс (валютный, мореходный)
_______выборы (избирательная кампания) - выбор (методическое решение)

Ключевые слова - словосочетания (лексические единицы - ЛЕ)

Употребление ЛЕ - словосочетаний должно быть минимальным. Но решение о разделении или сохранении ЛЕ - словосочетания должно приниматься, исходя из интересов поиска информации для каждой ее части. И если в словосочетании второе или какое-либо из последующих слов, входящих в словосочетание, имеет самостоятельное поисковое значение, его необходимо дополнительно вводить в качестве отдельного КС.

Не разделяются на отдельные ключевые слова и формулируются как КС - словосочетания следующие лексические единицы, состоящие из нескольких слов:
_______- идиоматические выражения, смысловое значение которых при разделении словосочетания на отдельные КС, теряется.
______________Например: круглый стол, красная строка, мозговой штурм, ласточкин хвост, прямая линия, черная дыра;
_______-законы, правила, явления, теории, формулы, оборудование, в названии которых есть имена их авторов, открывателей, изобретателей.
______________Например: бином Ньютона, теорема Ферма, эффект Доплера, теория Кейнса, теория Хекшера - Олина, лампа Чижевского

Данные ЛЕ вводятся без применения кавычек.

Фамилии персон дополнительно вводятся в видеокадре Лицо. Доп. описание.

При наличии сведений персонального характера следует в поле "смешанная информация" вводить фразу о нем. Если в индексируемом материале нет сведений персонального характера, то поле "смешанная информация" не заполняется, а в поле "код ответственности" вводится кодовое значение ассоциированное имя
_______- наименования светских, общественных и религиозных праздников, терминов народных календарей и лечебников
______________Например: День Победы, Татьянин день, День святого Валентина, пастушья сумка, бычья желчь, День пожилых людей.

Данные ЛЕ вводятся без применения кавычек. Вторые и (или) последующие слова из словосочетаний, имеющие поисковое значение, дополнительно вводятся в качестве самостоятельных КС:
______________Например: Татьянин день + День; Год ребенка + Ребенок; День налоговой полиции + Налоговый + Полиция
_______-названия кинофильмов, спектаклей, телесериалов, газет, журналов, имена собственные, присвоенные неодушевленным предметам (кораблям, подводным лодкам и т.д.) вводятся в базу КС в следующем порядке:
Каждое название заключается в кавычки (в том числе и те названия, которые состоят из одного слова). При этом дополнительно вводятся как отдельные КС слова Кинофильм, Спектакль, Газета, Журнал, Телесеhиал, Крейсер, Теплоход, которые в кавычки не заключаются.
______________Например :Спектакль "Горе от ума" разделяется на два КС: Спектакль и ЛЕ - словосочетание "Горе от ума"; Журнал "Мир библиографии" разделяется на два КС: Журнал и ЛЕ - словосочетание "Мир библиографии"; Кинофильм "Мама" разделяется на два КС: Кинофильм и "Мама", Теплоход"Адмирал Нахимов" разделяется на КС: "Адмирал Нахимов" и Теплоход; Подводная лодка "Курск" разделяется на три КС: Подводный + Лодка + "Курск".
_______- устойчивые словосочетания, относящиеся к определенным событиям или фактам и ставшие нарицательными, также вводятся как ЛЕ - словосочетания и заключаются в кавычки.
______________Например: "Ленинградское дело", "Дело врачей" "Холодная война". При этом, отдельные слова из словосочетания, имеющие поисковое значение, повторяют как дополнительные КС. В данных примерах это слова Дело, Врач, Война. Дополнительные КС в кавычки не заключаются.
_______-названия отдельных войн, битв, вооруженных конфликтов.
Данные ЛЕ - словосочетания вводятся с указанием даты (или диапазона дат), приводящейся непосредственно после формулировки через пробел и с проставлением букв, соответствующих дате или датам с временным диапазоном: В. или ВВ. в вековых датах и Г. или ГГ. в годовых датах.
______________Например: Куликовская битва 1380 г.
_____________________Корейская война 1950-1953 гг.

Отдельные слова из словосочетаний, имеющие поисковое значение, также повторяют в качестве дополнительных КС. В данных примерах это слова Битва и Война
_______- наименования наград (ордена, медали, звания, премии).
______________Например: Герой Советского Союза, Герой России, Орден Красного Знамени, Премия Нобеля, Орден Александра Невского и т.п.

Имена собственные, входящие в данные ЛЕ - словосочетания следует дополнительно вводить в видеокадре Лицо. Доп. описание. При наличии сведений персонального характера о лицах, именами которых названы награды, следует в поле "смешанная информация" вводить фразу о нем. Если в индексируемом материале таких сведений нет, в таком случае поле "смешанная информация" не заполняется, а в поле "код ответственности" вводится кодовое значение ассоциированное имя.

Если в данных ЛЕ - словосочетаниях есть слова, имеющие поисковое значение, их следует дополнительно вводить в качестве отдельных КС.
______________Например: КС - словосочетание Медаль за оборону Одессы следует дополнить двумя КС: Оборона и Одесса-история.
_______- наименования оборудования, машин, материалов и т.п., пишущиеся через дефис, также вводятся как ЛЕ - словосочетания с дополнительным вводом второго слова в качестве отдельного КС:
______________Например: Смеситель-запарник и Запарник
_______- наименования марок и моделей машин и других транспортных средств, оборудования, материалов вводятся в следующем порядке:

Аббревиатуры марок и моделей вводятся как отдельные КС и в кавычки не заключаются.
______________Например: Автомобиль + ВАЗ, Самолет + Ту-154

Собственные названия также вводятся как отдельные КС, но при этом заключаются в кавычки. Например: Автомобиль + "Москвич", Самолет + "Боинг".
_______- программы, конкурсы, проекты, имеющие собственное название, вводятся в базу КС без присвоенных им названий (КС являются Программа, Проект, Конкурс). А собственное название мероприятия вводится в видеокадр "Заглавие. Доп. описание".
______________Например: из словосочетаний Программа "500 дней", Конкурс "Окно в Россию" в базу КС водятся два понятия: Программа и Конкурс, а их названия вводятся в видеокадре "Заглавие. Доп. описание" в поле "Заглавие" (так как тексты или изложения их содержания являются печатным документом). Название в кавычки не заключается. При этом в поле "Сведения, дополняющие заглавие" следует повторить соответствующее слово Программа, Конкурс, Проект.
_______- числа и даты
ЛЕ - словосочетания, начинающиеся с цифр, формируются в следующем порядке: цифры, начинающие словосочетание, вводятся арабские. Затем через пробел вводится словесная формулировка ЛЕ.
______________Например: 1 класс, 1-4 класс, 10 класс. Если цифры в словосочетании сформулированы в виде диапазона (1-4 класс), в таком случае КС - словосочетание следует дополнять КС, "раскрывающими" цифры, находящихся внутри диапазона первого КС:
______________Например: КС 1-4 класс дополняется КС 2 класс, 3 класс, 4 класс
_______- числа и даты в базе КС краеведческого каталога
В базу КС краеведческого каталога дополнительно вводятся и отдельные числа, относящиеся к датам конкретных событий, годам жизни персон и т.д.
______________Например: 1 сентября, 1812 г. , 1899 - 1952 гг. , 1716 г. , 12 апреля 1961 г.

На словесную формулировку, сопровождающую число в КС - словосочетании следует дополнительно вводить отдельное КС.
______________Например: КС 1 сентября следует дополнить еще одним КС Сентябрь. КС - словосочетания, имеющие диапазон дат конкретных событий, следует дополнять КС на вторую дату диапазона.
______________Например: КС на годы жизни персоны 1899 - 1952 гг. должно быть дополнено вторым КС на вторую дату диапазона 1952 г.

КС - словосочетание на дату, состоящую из числа, месяца и года конкретного события, дополняется КС на словесную формулировку месяца и КС на дату года события.
______________Например: КС - словосочетание 12 апреля 1961 г. + КС Апрель + КС 1961 г.
_______- аббревиатуры - общепринятые, устоявшиеся или ГОСТированные сокращения вводятся как отдельные КС и одновременно формируются КС из отдельных частей полного значения аббревиатуры:
______________ВВП + валовой + внутренний + продукт
______________ВНП + валовой + национальный + продукт
______________СПИД + синдром + приобретенный + иммунодефицит
______________СИЗ + средство + индивидуальный + защита

Но наименования стран (США, СССР, СНГ и т.д.) вводятся в базу КС без дополнительного раскрытия аббревиатуры.
_______- географические названия вводятся в базу КС в следующем порядке:
______________наименования материков, континентов и отдельных местностей вводятся с применением инверсий: Америка Южная, Америка Латинская, Европа Восточная, Европа Центральная, Сибирь Западная;
______________наименования отдельных стран, состоящие из нескольких слов, вводятся без применения инверсий: Киевская Русь, Древняя Русь, Древняя Греция, Древний Египет;
______________географические названия собираются в базе КС в группы (географические блоки). Каждый такой блок состоит из наименования страны (континента, материка, отдельной местности) и вводимого через дефис наименования раздела таблиц ББК, соответствующего первым двум делениям таблиц, (в разделах 60, 87, 76 и 79 - трем делениям таблиц) из присвоенного данной библиографической записи индекса. Если БЗ имеет несколько индексов из разных разделов ББК, географический блок, относящийся к каждой стране (континенту) повторяется соответственно индексу каждого раздела.
_____________________Например: БЗ присвоено три индекса: 65.9(2Рос) + 65.30(2Рос) + 67.402(2Рос). В базу КС будет введено два словосочетания: Россия-экономика + Россия-право.

Или: БЗ присвоено два индекса из раздела Экономика, но касающихся разных стран: 65.261(7Сое) + 65.261(4Вел). В базу КС будет введено два словосочетания (два блока): США - экономика, Великобритания - экономика.

В географические блоки включаются также КС: развитые страны - тема, развивающиеся страны - тема.

Если в БЗ говорится об отдельной российской области (крае, республике, округе), тогда формируются два КС: Россия - тема и область (край, республика, округ) - тема.

Если в БЗ говорится о конкретном российском городе (областном или краевом центре), тогда тоже формируются два КС. Т.е., город-тема + Россия-тема.

Если российский город административно подчиняется области или краю, но не является областным или краевым центром, то формируются три КС: город-тема + область (край) -тема + Россия-тема.

Если российский город расположен на территории автономного образования (республики, края, округа), то независимо от того, является ли он центром автономного образования или не является, в базе КС формируются три КС: Россия - тема +республика (край, округ) -тема + город - тема.

Порядок заполнения поля КЛЮЧЕВЫЕ СЛОВА:

В базах КС Картотеки статей, Директивных материалов и Краеведения при вводе новых БЗ, в целях информирования, необходимо вводить КС с датой внесения БЗ в электронный каталог (ЭК). КС состоит из цифр, соответствующих месяцу и году ввода, разделенных знаком </> (косая черта). Таким образом, в каждой БЗ, введенной в январе 2001 года, должно быть КС1/01, в феврале 2001 года -КС 2/01 и т.п.

БЗ на статьи, имеющие продолжение, датируются при введении БЗ с окончанием статьи. При этом дата ввода должна соответствовать месяцу и году ввода БЗ с окончанием статьи.

В базе КС Генерального каталога (ГК) для формирования информационного бюллетеня новых поступлений вместо КС на дату ввода БЗ в ЭК вводятся КС, состоящие из аббревиатуры НП (новые поступления) и вводимого после дефиса наименования раздела таблиц ББК, соответствующего первым двум цифрам из присвоенного данной БЗ полочного индекса.

Таким образом, в каждую БЗ ГК вводится КС НП - тема, которое после составления очередного информационного бюллетеня новых поступлений исключается редактором ЭК из базы КС с помощью программы Корректор.

В процессе индексирования новых БЗ при формировании КС следует обязательно использовать возможность поиска и автоматического переноса из сформированной ранее базы КС тех ключевых слов, которые соответствуют тематике вводимых БЗ, во избежание разночтений, ошибок и опечаток, возможных при ручном наборе КС и для экономии времени, затраченного на ввод БЗ.

Составители: О.Е. Лебедева, Е.Л. Милушкина, М.П. Захаренко, О.П. Моисеенко, Н.Б. Герасенкова, А.С. Бочарова

2001 г.
март-апрель

Список использованной литературы:

1. Воройский, Ф.С. Индексирование документов в АБИС // Библиотека. - 1996. - №9. - С. 42 - 44
2. ГОСТ 7.59-90. Индексирование документов: Общие требования к систематизации и предметизации.- Введ. 01.01.91.- (Система стандартов по информации, библиотечному и издательскому делу)
3. ГОСТ 7.66-92 (ИСО 5963-85). Индексирование документов: Общие требования к координатному индексированию. - Введ. 01.01.93. - (Система стандартов по информации, библиотечному и издательскому делу)
4. Международная конференция "Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества (Крым' 99)": Материалы конф.: [В 2 т.]. - Судак, 1999
5. Международная конференция "Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества (Крым' 98)": Материалы конф.: [В 2 т.]. - Судак, 1998
6. Ханжин, А.Г. Разработка методики координатного индексирования документов. Ч.2. // НТИ. Сер.2. Информационные процессы и системы.- 1995. №9. - С. 14-19.

 

<Назад>____________<Вперед>____________<Содержание>____________<На главную>