12. Секция по формированию библиотечных фондов
Библиотечные фонды: проблемы и решения: электронный журнал-препринт.
№ 3, июнь, 2002
Визитная карточка как объект учрежденческих информационных технологий
В.В. Рубцов, Н.Н. Елкина (БАН)
Проникновение и внедрение новых информационных технологий в библиотечную практику почти сразу поставило библиотекарей перед необходимостью решать как минимум две задачи:
I - автоматизация библиотечно-библиографических процессов: библиографического описания, индексирования и поиска
II - автоматизированное создание сопроводительной документации по пути книги от обработки до книжной полки.
Третья, на наш взгляд, не менее важная задача ставится необходимостью упорядочивания различных массивов документов, хотя и не чисто библиотечных, но играющих важную роль в ее жизни. Именно такой массив документов представляют собой визитные карточки, поступившие и поступающие в Дирекцию Библиотеки от многочисленных визитеров и посетителей БАН. Массив таких документов на сегодня составил около 300 визитных карточек отечественных и зарубежных абонентов БАН.
Было решено создать локальную базу данных “Адресная книжка” (БД NOTEB), используя опыт собственной библиотеки. За основу формата ввода данных берется UNIMARC-подобный формат для машиночитаемых записей. Преимущество данного формата мы видим в том, что в нем обязательно присутствие полей и подполей, которые представляют собой структурированную текстовую информацию с точками доступа при поиске. Ввод и обработка данных осуществляются с помощью ППП CDS/ISIS/M версия 3.07 и выше. Используются как стандартные программы, так и оригинальные (авторские).
Система CDS/ISIS (Computerized Documentation System/Integrated Set of Information System) разработана в ЮНЕСКО в отделе разработки и применения программного обеспечения. Автором системы был руководитель этого отдела Жанпаоло Дель Биджио. CDS/ISIS для микрокомпьютеров разработан ЮНЕСКО в 1985 г., чтобы способствовать созданию баз данных на персональных компьютерах. Существующие в настоящее время версии CDS/ISIS используются на компьютерах класса IBM/PC и MS DOS, UNIX, VAX/VMS и других. На персональных компьютерах система работает в локальных вычислительных сетях класса NOVELL, WINDOWS-NT; готовится к распространению версия под управлением WINDOWS. В этом случае будет доступно использование средств мультимедиа, имитация визиток в графическом режиме, прямое соединение с абонентом прямо из БД и др.
Среди зарегистрированных пользователей системы CDS/ISIS более тысячи научных учреждений, около сотни национальных библиотек, международные, общественные, культурные, религиозные, государственные организации, библиотеки и архивы в странах Европы, Азии, Латинской Америки.
CDS/ISIS можно получить бесплатно через ЮНЕСКО или национальных дистрибьюторов. В России и странах бывшего СССР официальным дистрибьютором системы CDS/ISIS является ГПНТБ России.
По мнению создателей данного пакета прикладных программ, основная сфера применения CDS/ISIS это - автоматизация библиотек, архивов, музеев и документально-информационных служб. Вполне успешно эта системы может использоваться для автоматизации делопроизводства, работы канцелярии, секретаря и т.п. Наконец, она может использоваться как обычная ИПС [1].
“Адресная книжка БАН” использует ИПС, которая является адаптацией информационно-поисковой системы “СПРУТ”, разработанной в Научно-исследовательском отделе информатики и автоматизации для Электронного каталога БАН (рук. отдела канд. филол. наук В.П. Захаров). Автором разработки является ведущий инженер-программист НИОИА БАН В.В. Рубцов. (НИР ОКР 1999 г.).
ИПС СПРУТпредставляет собой многобазовый многоаспектный поисковый комплекс, предназначенный для ввода данных, их обработки и поиска. В ряде БД БАН используется обращение к графическим файлам непосредственно из ППП CDS ISIS, что позволяет выполнить профессиональный поиск электронной записи и увидеть изображение, связанное с ней. Для связывания графики с записями ППП CDS ISIS у нас имеется определенный опыт, а для просмотра изображений разработана подпрограмма, подключаемая к ИПС СПРУТ. С помощью файлов настройки системе указываются доступные массивы электронных записей баз данных, а в каждой БД соответствующие ей параметры поиска, которые могут включать до 15 индексированных элементов. ИПС СПРУТ предоставляет следующие возможности:
- Интерактивный доступ к фрагментам индексного файла, относящегося к конкретному поисковому параметру, например, имя персоны, название организации, тематическая рубрика и т. д.
- В пределах однотипного параметра можно указывать несколько значений, например, не одну, а несколько стран, городов, телефонных номеров и т.д.
- Можно составить поисковое предписание, учитывающее как один, так и несколько параметров в любых сочетаниях, например: имя персоны+название города+наименование организации.
- Использование индексного файла позволяет автоматически составлять поисковое предписание без набора с клавиатуры, простым переносом терминов поиска из индексного файла в поисковую таблицу, формируя, таким образом, строку запроса.
- Предоставляется также возможность ручной корректировки запроса, т.е. изменение логических операторов, расстановка скобок, усечение терминов и др.
- Сохранение стратегии поиска во время сеанса дает возможность оперировать результирующими списками для составления новых вариантов запроса. Стратегия поиска может быть сохранена после окончания сеанса работы.
- ИПС СПРУТ использует также все поисковые возможности, предоставляемые CDS/ISIS, например, контекстный поиск [2].
Разработка и создание электронной адресной книжки БАН относится к сфере автоматизации внутрибиблиотечных технологий, а именно научного делопроизводства. В соответствии с назначением данной поисковой системы и для ее успешного функционирования предусмотрено обязательное наличие основной БД и двух дополнительных сервисных баз данных, которые пополняются автоматически в ходе эксплуатации БД, но при необходимости сведения в них могут быть добавлены с помощью Рабочего листа БД вручную.
I. |
БД NOTEB |
Адресные сведения |
Основной информационный массив |
II |
БД ZAPRS |
Регистрация стратегии поиска |
Сервисный информационный массив |
III |
БД RDR |
Регистрация и учет пользователей |
Сервисный информационный массив |
На подготовительном этапе был выполнен анализ структуры информационных компонентов для типовой визитной карточки. В результате такого анализа выяснилось, что все данные могут быть разделены на две части: сведения о персоне и сведения об организации. К этим двум частям мы добавили третью – поисковые атрибуты. Такое добавление образуется в результате аналитико-синтетической обработки исходного текста и необходимо для организации поисковой системы. Таким образом, сведения каждой визитной карточки структурируются в трех блоках
I |
Персона |
II |
Организация |
III |
Поисковые атрибуты |
I. Сведения о персоне включают: |
II. Сведения об организации включают: |
|||
- имя - должность - звание - адрес - контакты |
- наименование организации - адрес - контакты |
|||
III. Поисковые атрибуты включают: |
||||
- предметную область занятий
|
|
Формат записи был разработан с учетом особенностей формата UNIMARC. Структурирование вводимых в БД сведений выполнено с максимальной степенью детализации и предназначено специально для поиска по запросам любой степени сложности и н е о ж и д а н н о с т и, например, в любых сочетаниях любых элементов записи, при полном или неполном знании того или иного реквизита. При разработке формата учитывался тот фактор, что визитные карточки представляют собой многоязычные документы. Учитывая это обстоятельство, назначены дублирующие поля для двух видов графики – кириллицы и латиницы. Поисковые возможности расширяются за счет введения специального блока поисковых данных. Для обеспечения разнообразия выходных форматов предусмотрены краткие и полные названия и наименования различных данных.
В общем виде структуры БД “Адресная книжка БАН” (NOTEB) имеет следующий вид:
I Персона:
Имя (кириллица/ латиница)
- Фамилия |
- Краткая форма имени (инициалы) |
- Полная форма имени (имя, отчество) |
- Псевдоним |
Должность (кириллица/ латиница)
- Краткое наименование должности |
- Полное наименование должности |
- Примечание |
Звание или научная должность (кириллица/ латиница):
- Краткое наименование звания |
- Полное наименование звания |
- Примечание |
Домашний / Служебный адрес персоны (кириллица/ латиница):
- Код страны (ИСО 3166) |
- Название страны (кириллица/латиница) |
- Название штата / федерального округа |
- Почтовый индекс |
- Название района города |
- Название улицы и номера дома и квартиры |
- Примечание |
Каждый из вышеназванных атрибутов: Имя, Должность, Звание, Домашний и служебный адрес персоны представлен в двух полях в зависимости от графики исходного документа. Кроме того, вне зависимости от языка визитки наименование страны приводится на языке оригинала и на русском языке.
Контакты личные/ служебные
- Телефон |
- Факс |
- Спутниковый телефон |
- Спутниковый факс |
- Мобильный телефон |
- Телетайп |
- Пейджер |
|
- Телекс |
- Адрес в INTERNET |
Каждый вид связи, упоминаемый в визитных карточках, является отдельным полем, код города и страны – подполем, доступным для поиска и сортировки.
Как “имя персоны”, так и “наименование организации” связываются с однотипными сведениями:
- именная часть
- адресная часть
- контакты
Формат “именной части” заимствован в основном из формата UNIMARC. “Адресная часть” и “контакты” разработаны нами самостоятельно.
- Организация:
Наименование организации (кириллица/латиница):
- Сокращенное наименование организации |
- Полная наименование организации (Головная организация) |
- Наименование подразделения организации (Подчиненная головной организации) |
- Наименование части подразделения (Подчиненная подразделению) |
- Наименование группы/комиссии и т.п. (Подчиненная части данного подразделения) |
- Примечание |
Атрибут Организацияпредставлен в двух полях в зависимости от графики исходного документа. В случаях наличия двуязычных наименований вводятся оба. Поиск в этом блоке проводится с учетом неполного знания точного наименования учреждения, т.е. предусматривает поиск по отдельным словам и усеченным терминам.
III - Поисковые атрибуты (специальные)
Блок поисковых данных состоит из 4-х полей, все из которых заполняются только на русском языке:
I. Предметная рубрика:
Главная рубрика (например, род занятий, специальность)
Первая подрубрика (например, сфера/область деятельности)
Вторая подрубрика (например, территориальная)
Третья подрубрика (например, хронологическая)
II. Географическая рубрика:
Административно-территориальное название
Период времени
- Ключевые слова
Ключевые слова исходного документа
IV. Пол
Ввод сведений в БД “Адресная книжка БАН” (NOTEB) осуществляется с использованием двух методик. Первая – стандартный ввод с помощью Рабочего листа CDS/ISIS, который включает метки полей и подполей и оснащен подсказками (Help) с правилами их заполнения. Вторая методика использует внешний текстовой файл – file dat, который может быть создан в любом редакторе как DOS, так и WINDOWS, т. е. вне программной среды CDS/ISIS/.
Привлекательность работы с текстовым файлом очевидна для библиотекарей. Вместо многочисленных специальных меток и букв латинского алфавита Рабочего листа CDS/ISIS, в файле * dat используется только цифровая метка поля и следующие три символа: звездочка, тире и косая черта. Следующим преимуществом является возможность проверки правильности заполнения с помощью специальной программы. Эта программа указывает местонахождение и тип ошибки. После дополнительной проверки файл автоматически загружается в БД. Практика показывает, что для редактирования отдельных записей или небольших массивов очень удобно выгружать их в такой текстовой файл, исправлять и возвращать в БД. Подобная технология успешно используется в других автоматизированных подсистемах БАН, например, в Библиотеке БИН, в Пушкинском Доме, в БАН для биобиблиографической БД “Персоналия БАН: 1714-1940-е” и др.
Поиск данных в “Адресной книжке БАН” и их представление на экране и в файле решается с помощью стандартных режимов и форматов представления. ППП CDS/ISIS имеет мощный язык форматирования, с помощью которого создаются документы любой конфигурации. При работе с БД NOTEB используется унифицированная технология выгрузки и представления данных в обменном текстовом формате RTF или TXT. Таким образом, могут быть созданы любые справки в ответ на внешние и внутренние запросы к системе.
Форматы вывода назначаются, исходя из практических надобностей и возможностей, предоставляемых ИПС СПРУТ из списка.
- Именной – полный |
- Именной – краткий |
|
- Учрежденческий – полный |
- Учрежденческий – краткий |
|
- Должностной |
- Географический |
|
- По видам контактов |
- Другие |
CDS/ISIS позволяет динамически менять форматы представления, в зависимости от практических надобностей. Данные БД могут быть выгружены полным/выборочным списком, или по одной записи, с сортировкой или без нее.
Примеры выгрузки записей из БД “Адресная книжка”:
000035 КАРОЧКИНА ГАЛИНА ФЕДОРОВНА Karochkina Galina Ист Вью Пабликейшнс, Инк. Отдел продаж в России и Новых Независимых Государства East View Publications, Inc. Sales and Marketing in Russia/NIS Дом. тел.: (-) Раб. тел.: (095) 318-0937 (095) 318-0881 |
000049 ЛИСЕЕВ ИГОРЬ КОНСТАНТИНОВИЧ Liseyev Igor Konstantinovich ИФ РАН. Институт философии РАН; РЭА. Российская экологическая академия= IPH RAS. Institute of Philosophy Russian Academy of Sciences REA. Russian Ecological Academy Дом. тел.: (0XX) XXX-XXXX Раб. тел.: (095) 203-9098 (095) 203-9671 |
000068 НИКИТЕНКОВА НАДЕЖДА ПАВЛОВНА Библио-Глобус. Торговый Дом Библио-Глобус Дом. тел.: (-)Раб. тел.: (095) 921-6340 |
000050 ЛИТВАН РОМАН ИЛЬИЧ СРПП Москва. Союз Распространителей Печатной Продукции Раб. тел.:(095) 911-0823 |
000057 МАСЛОВ АЛЕКСАНДР НИКОЛАЕВИЧ НОУ Луч. Негосударственное Образовательное Учреждение “Луч” Дом. тел.: (-) Раб. тел.:(095) 454-0054 |
000065 МУРАТОВ АЛЕКСЕЙ ЛЕОНИДОВИЧ Muratov Alexey L РКП. Российская Книжная Палата RBC. Russian Book Chamber Дом. тел.: (-) Раб. тел.:(095) 298-2602; (095) 203-5608 |
000081 РУЗАЙКИН ГЕЛЯ ИВАНОВИЧ Мир ПК. Мир Персональных Компьютеров Дом. тел.: (0ХХ) ХХХ-ХХХХ Раб. тел.: (095) 253-9227 |
000102 ТАРИК АХМЕД АЛЬ-ХАЙДАН Tariq Ahmed Al-Haidan Посольство ОАЭ. Посольство Объединенных Арабских Эмиратов Embassy of the UAE. Embassy of the United Arab Emirates Дом. тел.:(-)Раб. тел.: (095) 147-6286 (095) 147-0066 |
На наш взгляд, использование ППП CDS/ISIS, ИПС СПРУТ и INIMARC-подобного формата удовлетворяет всем требованиям, предъявляемым к разработке баз данных – объектов учрежденческих информационных технологий и в дальнейшем могут быть использованы для автоматизации иных библиотечных процессов. Например, вполне реально создание автоматизированной системы регистрации читателей на пункте записи, абонементе и в читальных залах и др.
Литература:
- Хопкинсон А. CDS/ISIS и UNIMARC. Использование формата ISO 2709 с CDS/ISIS // Науч. и техн. б-ки., 1997, № 6, с.11-27.
- Рубцов В.В. Библиотековедение - новые подходы / В.В. Рубцов, Н.Б. Брачковская, Н.В. Пономарева.// Региональная информатика - 2000: VII Санкт- Петербург. межд. конф. 5-8 дек. 2000 г.: Тезисы докл. - СПб., 2000. - Ч.2. - С. 24.