Рекомендации по выбору систем метаданных для электронной библиотеки

2005 г.

Содержание

Введение

1. Сущность понятие «метаданные», группы и типы метаданных

2. Основные системы метаданных

3. Сопоставительный анализ Дублинского ядра и других систем метаданных

Заключение

Список литературы

Введение

В развитых странах информация является важнейшим объектом производственной деятельности и потребления, поскольку оказывает значительное или даже решающее воздействие на направления и результаты прогресса в научной, технической, культурной, экономической и других сферах жизни этих стран.

Гигантские объемы уже накопленной информации, непрерывно продолжающийся рост ее количества, разнородный и разобщенный по многим признакам характер хранения и распространения, отсутствие унифицированного доступа к ней создают существенные и все возрастающие проблемы ее эффективного использования.

Создание электронных библиотек и соответствующих информационных инфраструктур бурно происходит по всему миру. Проекты по созданию электронных библиотек развива-ются в России на протяжении примерно пяти последних лет, причем их значимость и интенсивность постоянно возрастает.

Под электронной библиотекой понимается распределенная информационная система, позволяющая надежно накапливать, сохранять и эффективно использовать разнообразные коллекции электронных документов, доступные в удобном для пользователей виде через глобальные сети передачи данных.

Система метаданных является центральным логическим компонентом любой электронной библиотеки (ЭБ). Подобно тому, как библиотечный каталог организует все множество единиц хранения в систему библиотечных фондов, вокруг которой строятся все библиотечные технологии, система метаданных организует совокупность электронных информационных ресурсов (или цифровых объектов) ЭБ.

Целью курсовой работы является исследование особенностей различных систем метаданных. В соответствие с поставленной целью решаются следующие задачи:

- исследовать сущность понятие «метаданные», группы и типы метаданных;

- изучить основные системы метаданных;

- провести сопоставительный анализ Дублинского ядра и других систем метаданных.

При подготовке курсовой работы использовались научно-учебные пособия и монографии, публикации периодической специализированной печати, материалы научно-практических конференций и Интернет.

1. Сущность понятие «метаданные», группы и типы метаданных

Традиционная библиотечная практика систематизации и каталогизации применяется для обеспечения поиска информации и в ряде электронных библиотек. Но основная проблема ее использования заключается в том, что такой подход требует участия достаточно квалифицированного каталогизатора и систематизатора, большой и трудоемкой ручной работы, которую невозможно обеспечить в более-менее удовлетворительном объеме, когда речь идет о стремительно растущих и поражающих воображение своими объемами информационных ресурсах глобальной сети Интернет. Кроме того, появились совершенно новые виды электронных информационных ресурсов (web-страницы, web-сайты, порталы, базы электронных журналов и т.п.), которые имеют ряд характеристик, не предусмотренных существующими форматами, предназначенными для хранения и обмена библиографической информацией.

Ряд создателей онлайновых библиографических, реферативных и полнотекстовых баз данных не обеспечивают полную каталогизацию и классификацию всех входящих в базу записей и документов, а применяют для обеспечения поиска в базах данных (БД) специальные алгоритмы их индексирования. В ряде случаев такие системы создают один или несколько индексов на основе информации, извлеченной из различных полей БД, например, автор, название и т.п. Индекс также содержит ключевые слова и/или дескрипторы, создаваемые или человеком-индексатором или автоматически на основе названий, рефератов, полных текстов документов. Такие системы позволяют пользователям искать информацию, с помощью терминов и фраз, сформированных на основании содержимого одного или нескольких полей БД. В последние годы были предприняты попытки создания новых систем каталогизации информационных ресурсов сети Интернет на основе использования так называемых метаданных. Историю использования термина «метаданные» некоторые исследователи прослеживают начиная с 1960-х гг., отмечая при этом, что более часто он стал использоваться в литературе по разработке систем управления базами данных в 1980 гг. В литературе по информационно-библиотечным наукам термин «метаданные» стал популярен с середины 1990-х гг. и сегодня он упоминается в сотнях ежегодно выходящих изданий.

Вокруг системы метаданных и на ее основе строятся основные технологические процессы электронной библиотеки, а именно^¹:

• навигация в информационном пространстве ЭБ;
• поиск отдельных цифровых объектов (информационных ресурсов) или их совокупностей
• ввод, обработка и организация хранения цифровых объектов, а также их исключение (изъятие);
• управление правами доступа к цифровым объектам, включая защиту авторских прав, организация платы за доступ и пр.

Общим свойством метаданных является их относительный характер. Сведения, которые в одной информационной системе являются метаданными, в другой могут быть собственно данными. Наиболее характерный пример — библиографические или реферативные базы данных, которые в информационных системах прежних поколений являлись метаданными по отношению к традиционным (бумажным) ресурсам (иногда называвшимся вторым контуром информационных систем). В то же время для процессов, выполняемых в самой АБИС, эти БД содержали именно данные.

Исследователи различают следующие 3 группы метаданных^²:

1. Метаданные, создаваемые web-службами индексирования и поиска (это данные, собираемые программами-роботами на основе использования протокола http и скриптов CGI для автоматического создания записей об онлайновых информационных ресурсах).

2. Метаданные, используемые для описания информационного ресурса (например, форматы Dublin Core и IAFA/WHOIS++ (проект ROADS); записи могут создаваться вручную или автоматически).

3. Метаданные, используемые для задания месторасположения, анализа, оценки, документирования и т.п. информационного ресурса (такие метаданные довольно сложные и очень детализированы, что требует привлечения специалистов для их разработки и сопровождения).

Большинство исследователей выделяет следующие типы метаданных^³:

• описательные, например, библиографическая информация или другие сведения о содержании (семантике) цифровых объектов;

• структурные, включая сведения о форматах, структуре, объеме и других формальных свойствах цифровых объектов;

• административные — права, разрешения на доступ, на коррекцию данных, данные о пользователе, данные для систем оплаты, технологические данные.

Особым типом метаданных является идентификатор, задача которого — однозначное представление цифрового объекта для внешнего мира и различных приложений.

Часто «метаданные» трактуются как «данные о данных», но такое определение мало что дает для понимания сути метаданных. Поэтому их чаще характеризуют следующим образом:

• данные, которые описывают атрибуты (характеристики) документа (информационного ресурса);

• данные о документе (информационном ресурсе), которые дают его потенциальному пользователю возможность получить полную предварительную информацию о существовании документа и его характеристиках;

• данные (информация) о документе, «понимаемая» компьютером (machine understandable).

2. Основные системы метаданных

Целесообразно охарактеризовать некоторые наиболее известных систем метаданных^⁴:

DC- Дублинское ядро метаданных -консорциум W3.
CSDGM — стандарт для цифровых геопространственных данных Документ направлен на выработку общей терминологии геопространственных метаданных. Одобрен в 1994 г. на заседании Федерального комитета по географическим данным США и затем утвержден Правительственным распоряжением 12096, которое обязывает американские федеральные организации использовать этот стандарт, начиная с 1995 г. Федеральный комитет развивал этот стандарт, чтобы помогать идентифицировать источники пространственных данных и обеспечивать доступ к данным через Национальную информационную инфраструктуру. Стандарт метаданных GSDGM содержит 334 элемента данных, более 100 из которых служат для описания связей между элементами.
DIF — формат обмена для справочников геопространственных данных . Структура данных для каталога метаданных, создаваемая NASA и поддерживаемая в США межведомственной рабочей группой по управлению данными для глобального обмена. Формат был разработан в конце 1980-х гг. для обмена спутниковой и другой телеметрической информацией. Позже стал использоваться для любых геопространственных данных и стал стандартом де-факто в международных глобальных информационных системах. Стандарт вводит элементы метаданных, определяет их содержание и структуру для передачи метаданных в информационных системах. Стандарт позволяет пользователю определить, содержит ли набор данных релевантную информацию.
GILS — Глобальная (правительственная) служба поиска информации. Являясь частью Национальной информационной инфраструктуры, GILS обеспечивает доступ частным лицам и организациям к федеральным информационным ресурсам, через общедоступный каталог этих ресурсов. GILS базируется на международных стандартах информационного поиска с использованием протокола доступа Z39.50 и использует систему метаданных в рамках этого протокола. Развитие системы GILS предполагает создание системы взаимосвязанных каталогов для поиска метаданных, возможно, различных типов.
MARC — машиночитаемый каталог. Один из старейших и самых известных и распространенных в России и в мире стандартов метаданных. Отличается детальным составом элементов данных, универсальностью, развитой структурой. Ориентирован на библиотечную практику, имеет конкурирующие версии и высокую стоимость эксплуатации.
ЕАД. — кодировка архивных описаний. Набор изначально текстовых метаданных на базе языка разметки SGML , разработанных для нужд архивов и используемых для стандартизации и классификации уникальных архивных материалов, прежде всего рукописей. Версия 1.0. 1998 г. совместима с форматом XML. Поддерживается Американским архивным обществом и Библиотекой Конгресса США.
TEI - инициатива по кодированию текстов: разработана в Центре электронных текстов Вирджинии в 1989 г. как инструмент при процессе оцифровке, который идентифицирует электронный ресурс и его печатный источник посредством метаданных, размещаемых внутри самого электронного ресурса.
IAFA/WHOIS++: шаблонно ориентированные метаданные для описания сетевых ресурсов, первоначально использовавшиеся для описания списков электронной почтовой рассылки, других ftp-архивов, а позднее распространенные на другие ресурсы. Наиболее широкое применение наблюдалось в рамках ранних проектов британской программы по электронным библиотекам eLib (ROADS и т. д.), но даже сейчас эта схема метаданных считается одной из самых употребительных.
Интероперабельность данных в системах электронной коммерции -INDECS. Набор метаданных, который развился из потребностей электронной коммерции в сфере шоу-бизнеса (музыка, зрелища и др.). Представляет собой наиболее сложный набор метаданных, ориентированных на управление правами на цифровой объект (вид интеллектуальной собственности, лицензионные сборы, перечисление средств правообладателям и проч.). Создается в связке с одной из наиболее известных систем идентификации цифровых объектов DOI (Digital Object Identification).
EDIFACT- одна из старейших международных систем метаданных, содержащих правила и структуру описания торгово-транспортных и других коммерческих документов. С 1998 г. поддерживается языком XML.
MATER — система метаданных, описывающая словари, классификаторы и другие лексикографические данные. Поддерживается стандартами ИСО. Имеется российская версия под названием ФОЛИЯ (Формат обмена лексикой информационных языков).
Формат Государственного регистра баз и банков данных. Российский стандарт, действующий с конца 1980-х гг. и содержащий систему метаданных для баз данных и других электронных наборов данных. Утвержден Правительством РФ, поддерживается НТЦ “Информрегистр”, применяется в ряде отраслей и регионов, а также в странах СНГ для ведения баз метаданных.

3. Сопоставительный анализ Дублинского ядра и других систем метаданных

В качестве базового средства формирования метаданных для описания широкого класса цифровых объектов обычно упоминается Дублинское ядро метаданных^⁵. Так, при опросе специалистов различных стран, присутствовавших в декабре 2000 г. в Лондоне на очередной выставке Online Information, в качестве наиболее перспективного стандарта метаданных для описания электронных ресурсов представители США, Англии, Франции, Германии, Японии, не сговариваясь, называли именно Дублинское ядро. Известно, что уже ряд национальных систем объявили о принятии Дублинского ядра в качестве национального стандарта (Австралия, Швеция).
С 1995 года международная группа под руководством Stuart Weibel из OCLC работает над созданием простого набора элементов метаданных, которые могли бы применяться для широкого набора библиотечных материалов. Набор таких элементов, созданный группой, известен под именем Дублинского ядра по названию города Dublin в штате Огайо, где расположена штаб-квартира OCLC и где состоялась первая рабочая встреча. Несколько сотен людей участвовали в рабочих встречах Дублинского ядра или в обсуждениях посредством электронной почты. Присущий им дух сотрудничества является примером того, как индивидуумы с различными интересами могут работать вместе..
Следующие пятнадцать элементов составляют набор метаданных Дублинского ядра . Все элементы являются необязательными и могут повторяться.
Title (Заголовок) — название, присвоенное ресурсу создателем или издателем.
Creator (Автор) — человек или организация, изначально ответственная за интеллектуальное содержание ресурса (в случае рукописного документа это авторы; исполнители, фотографы или иллюстраторы в случае визуальных ресурсов).
Subject (Предмет) — тема ресурса. Обычно предмет выражается в ключевых словах или фразе, описывающей предмет или содержание ресурса. Приветствуется использование контролируемых словарей и формальных схем классификации.
Description (Описание) — текстовое описание содержания ресурса, включая реферат в случае документов или описание содержания в случае визуального ресурса.
Publisher (Издатель) — организация, ответственная за создание ресурса в его нынешней форме — например, издательский дом, университетский департамент или корпорация.
Contributor (Участник создания материала) — человек или организация, которые не являются авторами (не обозначены в элементе “автор”), но внесли значительный интеллектуальный вклад в ресурс, но чей вклад вторичен по отношению к любому человеку или организации, указанной в числе авторов — например, редактор, переводчик, иллюстратор.
Date (Дата) — дата, указывающая на создание или появление (в доступном виде) ресурса.
Type (Тип) — категория ресурса — например, домашняя страничка, роман, поэма, статья, препринт, технический отчет, эссе, словарь.
Format (Формат) — формат представления данных ресурса (обычно указывается тип программного обеспечения и — возможно — тип компьютера, которые могут быть необходимы для отображения и работы с ресурсом).
Identifier (Идентификатор) — набор букв или цифр, который обычно используется для уникальной идентификации ресурса. В случае сетевых ресурсов примерами являются URL и URN.
Source (Источник) — информация о вторичном источнике, из которого был получен настоящий ресурс.
Language (Язык) — язык, на котором изложено интеллектуальное содержание ресурса.
Relation (Связь) — идентификатор вторичного ресурса и его связь с настоящим ресурсом. Этот элемент позволяет связывать между собой близкие ресурсы, а также описания ресурса, которые необходимо показать. Примеры — издание книги и глава книги.
Coverage (Охват) — характеристики местонахождения и временной продолжительности ресурса.
Rights (Права) — утверждение об авторских правах и управление ими; идентификатор, связанный с таким утверждением; идентификатор, связанный с сервисом, представляющим информацию об управлении правами на данный ресурс.
Как указывается в RFC2413, элементы Дублинского ядра можно условно разбить на три группы:

Content — элементы, в основном относящиеся к содержанию ресурса;
Intellectual Property — элементы, в основном рассматриваемые с позиции интеллектуальной собственности;
Instantiation — элементы, в основном относящиеся к данному экземпляру ресурса.

Content	Intellectual Property	Instantiation
Title	Creator	Date
Subject	Publisher	Format
Description	Contributor	Identifier
Type	Rights	Language
Source
Relation
Coverage

Основное преимущество Дублинского ядра заключается в том, что если традиционные методы каталогизирования требуют профессиональной подготовки для эффективного использования, Дублинское ядро использовать весьма просто. Однако простота конфликтует с точностью. Команда много работала над этим парадоксом. Первоначальная цель заключалась в создании простого набора элементов метаданных для неподготовленных людей, которые публикуют электронные материалы с описанием своих результатов. Некоторые продолжают придерживаться этого минималистского подхода, они хотели бы видеть простой набор правил, которыми мог бы воспользоваться любой. Другие предпочитают ориентироваться на преимущества более тщательно разработанных правил каталогизирования и согласны на увеличение трудоемкости и стоимости. Они указывают на то, что дополнительные структурные элементы позволяют добиться большей точности в метаданных. Например, если поле “предмет” заполнялось с использованием классификатора Дьюи, было бы полезно отразить этот факт в метаданных. Для дальнейшего повышения эффективности метаданных при обработке информации, предлагается присваивать некоторым элементам некоторые “значения”. Это может быть определенный набор, список типов, которым могут руководствоваться составители описаний.

Таким образом, можно сказать, что стратегию Дублинского ядра развивают “минималисты” с одной стороны, и “структуралисты” с другой. Первые исходят из первоначального намерения создать систему, полезную для людей без специальной подготовки. Вторые хотят создать систему более сложную, требующую исчерпывающего описания и подготовленных сотрудников.

Пятнадцати элементов явно недостаточно для информационных систем типа электронных библиотек. Для того, чтобы сохранить совместимость с простейшим описанием из 15 элементов и, в то же время, увеличить детализацию и сложность описаний различные организации, в том числе и рабочие группы самой Инициативы Дублинского ядра (DCMI) разрабатывают расширения, дополнительные квалификаторы для базовых элементов. Длительное время в этом вопросе наблюдались определенный произвол и неопределенность, однако, летом 2000 г. появились рекомендации DCMI, описывающие набор квалификаторов.

Ряд специалистов считает, что Дублинское ядро, разработанное в результате выделения минимального ядра на основе компромисса, имеет ряд существенных недостатков. Среди них Г.Руст^⁶ отмечает следующие:

отсутствуют описания таких понятий как продолжительность, размер или число компонентов;
отсутствуют связи между местоположением и событиями (датами);
недостаточна гибкость для описания времени (нет диапазонов протяженности, возможности работы с минутами и секундами);
произвольно отделены Creators и Contributors (а также, что менее важно, Titles and Identifiers), отсутствуют условия для определения их роли или статуса;
Description рассматривается как аннотация, описательный элемент вместо логически отдельной единицы с собственными признаками и правами;
Publisher трактуется как описательный, а не правовой элемент;
элементы Source и Relation неадекватно описывают отношения создания;
определениям недостает точности.

Статья Г.Руста характерна как пример претензий к Дублинскому ядру со стороны отраслей, для представления которых его возможностей недостаточно (однако следует иметь в виду, что минимальный набор элементов в принципе не предназначен для описания тонких вопросов специфического сектора). Тем не менее, представляется полезным проследить аргументацию автора. Далее он пишет: “Имеются существенные вопросы по большинству из пятнадцати элементов. Их группировка в три категории (Content, Intellectual Property и Instantiation) реально не помогает. Почему, например, Title относится к Content ,а Identifier — к Instantiation? Одно произведение может иметь различные названия в различных контекстах. На каждой стадии Dublin Core оставляет возможности для большого числа исключений из правил.

Во-вторых, признаки, терминология и примеры взяты преимущественно из текстовых произведений. Это в значительной степени не соответствует интересам владельцев и издателей звуковых, аудиовизуальных и абстрактных работ, несмотря на наличие перекрестных словарей.

В-третьих, структура Дублинского ядра не является ни достаточно жесткой, чтобы удовлетворить требования системы основанной на правах (которые нуждаются в фиксированной структуре), ни настолько свободной, чтобы согласовать структуру, взятую из другого источника. Признаются принципы заимствования стандартных наборов значений (особенно Canberra Qualifiers) но не применяются достаточно жестко.

Наконец — и это главная трудность применения Дублинского ядра для правообладателей — метаданные права рассматриваются там как дополнительный, 15-й элемент (Rights) притом, что фактически это понятие охватывает 13 из других 14 элементов. При последовательном и корректном понимании вопросов, связанных с правами и описывающими метаданными, следовало бы переделать половину Дублинского ядра, либо полностью игнорировать эти понятия.

Все это может привести к тому, что владельцы прав создадут собственный набор, удовлетворяющий их потребностям. Однако в сетевой структуре бессмысленно иметь один набор метаданных для исследований, а другой — для управления правами: по сути, это одно и то же.

Разработчики Дублинского ядра утверждают, что внедрение единой системы метаданных на этой основе поощрило бы авторов и издателей сопровождать свои данные ими же разработанными метаданными. Это позволило бы разработчикам средств для сетевых публикаций включать непосредственно в программное обеспечение шаблоны для этой информации, облегчая поставщикам информации их разработку. Метаданные, созданные информационными провайдерами, должны служить базой для более детальной каталогизации или описаний в конкретных предметных областях. Вдобавок это обеспечило бы общий для всех приложений базовый набор элементов, даже если определенным профессиональным группам потребовалась бы более специфическая информация. В то время как имеющиеся поисковые машины не в состоянии обеспечить релевантные результаты поиска при просмотре огромного количества ресурсов Интернета, поиск с использованием метаданных мог бы дать гораздо более точные результаты.

Универсальность Дублинского ядра не всеобъемлюща, и для отдельных предметных областей надолго сохранится потребность в локальных стандартах, учитывающих специфику отрасли — при использовании схожих подходов и принципов.

Хотя в настоящее время проект INDECS формально закрыт, работы в этом направлении не прекращаются. Его участники основали некоммерческую организацию Indecs Framework Ltd, продолжается сотрудничество с International DOI Foundation (IDF). В любом случае этот проект является наиболее продвинутым в направлении систем метаданных, ориентированных на управление правами на цифровые объекты. В связи с этим ведутся исследованию по сопоставлению системы метаданных INDECS c другими системами метаданных. Наиболее подробный анализ в этом направлении сделан представлен на http://www.indecs.org/pdf/Summary/Report/pdf.

Особый интерес представляет система метаданных, используемая в системе GILS. Дело в том, что идеология этой системе практически тождественна принципам функционирования Государственного регистра баз и банков данных, который по замыслу, должен стать ядром навигационной системы всех государственных информационных ресурсов России. В связи с этим приведем краткий обзор GILS по материалам^⁷. В соответствии с этим текстом, цель GILS — обеспечить гражданам поиск всех информационных ресурсов, созданных за средства налогоплательщиков — на любых носителях и языках. Выбранная стратегия наследует международные стандарты информационного поиска, в частности, стандарт ISO 23950, эквивалентный американскому стандарту ANSI/NISO Z39.50 (в 1997 г. ISO заменил ISO 10162 и ISO 10163). Z39.50 был первоначально разработан для использования в библиотечной среде и информационных службах, а к настоящему времени получил широкое применение в глобальных сетях.

В рамках GILS требуется описывать не только книги и наборы данных, но также людей, события, собрания, артефакты и т. д. Что касается сетевой информации, GILS поддерживает гиперссылки для доступа к взаимосвязанным ресурсам.

15 элементов Дублинского ядра отображаются на систему метаданных GILS с помощью специальных средств^⁸. В Дублинском ядре нет фиксированных правил синтаксиса (хотя существует соглашение W3C о том, как записывать элементы Дублинского ядра на HTML). В этом Дублинское ядро и GILS сходны. В отличие от GILS, Дублинское ядро не определяет поисковые средства. GILS-согласованный поиск может успешно работать в сочетании с семантикой Дублинского ядра.

С конца 1960-х гг. обмен каталожными записями был компьютеризирован. С этой целью группой сотрудников Библиотеки Конгресса США во главе с Генриеттой Аврам (Henriette Avram) был разработан формат обмена библиографической информацией MARC (Machine-Readable Cataloging) для распространения каталожных записей на магнитной ленте. Каталогизирование с использованием формата MARC распространилось не только на монографии, но и на другие виды документов, включая продолжающиеся издания, архивы, неопубликованные рукописи и т.п.

В MARC информация разнесена по полям, каждое из которых имеет трехзначный код. Например, код 440 - это поле названия серии монографий, поля 650 - предметные рубрики (subject headings) Библиотеки Конгресса США.

Специальные правила говорят библиотечному работнику, какое поле необходимо использовать и как должна интерпретироваться взаимосвязь между элементами.

Процесс создания библиографической записи – очень сложных и трудоемкий процесс. Полный формат MARC состоит из определенного набора полей, каждое из которых идентифицируется определенной меткой (tag). В полях допускаются подполя. Поля обозначаются трехзначной цифровой меткой, подполя - одной буквой. Чтобы получить представление о том, как информация кодируется в формате MARC, рассмотрим поле с меткой 260 ("выходные данные"), которое начинается как &260. В реальной записи это означает следующее (причем последовательность abc указывает на наличие трех подполей):

&260 #a[Bedford, Mass.] : |b Digital Press, |c c1990.

Первое подполе, обозначенное меткой а, указывает на место публикации; следующее, обозначенное как b, - издателя; третье, с - дата публикации.

MARC был передовым форматом в то время, когда большинство компьютерных систем представляли текстовые поля только фиксированной длины и только с заглавными буквами. Он остается актуальным для библиотек, но его солидный возраст очевиден. Его замена на более современный,отвечающий сегодняшним потребностям формат осложнена тем огромным объемом средств, которые были инвестированы библиотеками в его внедрение, и теми огромными информационными ресурсам, в которых он используется. Но что бы ни произошло в будущем, MARC был пионерским достижением как в истории компьютерных технологий, так и в истории библиотек. Это ключевой формат, который безусловно должен поддерживаться в ЭБ.

GILS наследует семантику MARC для элементов, используемых для поиска. Взаимно однозначное соответствие между элементами GILS и MARC описано в GILS Profile^⁹.

GILS создается с целью интеграции библиотечных и сетевых ресурсов на основе сочетания библиотечной практики библиографических описаний с сетевыми и компьютерными технологиями. Поскольку GILS является важной составной частью Национальной информационной инфраструктуры, его идеологи ставят широкомасштабные цели реализации права на информацию в рамках создания глобального информационного сообщества..

Однако С.В.Кузнецов в докладе, подготовленном для российско-американского семинара по GILS^¹⁰, отмечает, что протокол Z39.50 использует американский национальный библиографический формат USMARC и 8 классификаторов библиографической информации, из которых только 2 являются международными (УДК и Дьюи). За 7 лет существования протокола Z39.50 созданы лишь около 700 GILS-совместимых сервера — сотые доли процента общедоступных ресурсов Интернета. Указанный протокол даже в США не является общепринятым, поскольку он реализуется на федеральном уровне, и правительства штатов и, тем более, муниципальных организаций не обязаны применять этот стандарт.

Заключение

Системы метаданных являются одним из важнейших компонентов электронных библиотек, который в значительной степени определяет функциональные возможности ЭБ и, шире, универсальных систем информационного поиска. Поскольку основной средой реализации ЭБ является Интернет, весьма важным и определяющим является учет в проектных решений в области метаданных требований сетевой среды. Основным вариантом в настоящее время являются решения, основанные на использовании языка XML и протокола HTTP . В то же время развивается система метаданных GILS, основанная на протоколе Z39.50, который многие специалисты считают неперспективным.

Если говорить о семантике метаданных, то по популярности как среди российских, так и среди зарубежных исследователей с большим отрывом лидирует проект универсальной системы метаданных Дублинского ядра. В то же время, в пределах определенных категорий цифровых объектов, таких как геопространственные системы, книжная торговля или музейные ресурсы, тематически ориентированные метаданные распространены гораздо больше, чем универсальные. В этой связи наибольшие трудности разработчиков электронных библиотек ожидают именно при попытках внедрения универсальных решений, если эти решения хотя бы отчасти семантизированы. Кроме того, проект Дублинского ядра подвергается критике с точки зрения его возможносте для проблемы управления правами доступа к цифровым объектам.

Наиболее продвинутой в России является система библиографических метаданнных, основанная на формате MARC, создаваемая при активной поддержке Минкультуры России. Внедрение этой системы практически охватывает большинство библиотечных автоматизированных систем, доступных через Интернет. Действующая в настоящее время программа РФФИ по электронным библиотекам сформирована таким образом, что общесистемные исследования, к которым относится и системы метаданных, не востребованы.

В других областях достижения в области метаданных более скромны: в электронной коммерции начинают применяться Интернет-приложения системы EDIFACT, а в ГИС-сообществе делаются попытки внедрения стандарта на метаданные для геопространственных данных, основанные на стандарте DIF. Кроме того, функционирует и постепенно распространяется система метаданных Государственного регистра баз и банков данных. Естественно, также создаются системы метаданных и для различных конкретных систем, например, для Государственного регистра населения или Федерального земельного кадастра. Однако все эти проекты разрознены и не образуют сколько-нибудь единого подхода к проблеме метаданных. Можно, однако, надеяться, что этот пробел будет устранен при реализации Межведомственной программы “Электронные библиотеки России”, идеология которой направлена именно на общесистемные разработки и обеспечение совместимости информационных ресурсов. России.

Список литературы

Шрайберг Я.Л. Основные положения и принципы разработки автоматизированных библиотечно-информационных систем и сетей: Главные тенденции окружения, основные положения и предпосылки, базовые принципы: Моногр.— М. :ГПНТБ России, 2000.
Антопольский А.Б. Системы метаданных в электронных библиотеках. - НТЦ “Информрегистр”, Москва, Россия, 2001. http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML
Лапо П.М., Соколов А.В. Введение в электронные библиотеки, 2005. http://natlib.org.by/html/news2005/7july/data/PDF.pdf
Антопольский А.Б., Вигурский К.В. Электронные библиотеки.
http://www.kursknet.ru/~kcnti/cgi-bin/number.pl?number=47&st=6
Антопольский А.Б. Проблемы государственного и общественного регулирования сферы российских информационных ресурсов сети Интернет. Концептуальная записка к заседанию НТС Минсвязи России 19.10.2000.
ISO Project 21047 (ISTC) Working Draft 1.1/ ISO TC 46/SC9 http://www.nlc-bnc.ca
.http://www.indecs.org
Бейкер Т., Лагозе К. Стандарты и метаданные (практикум IFLA/DELOS/NSF в рамках конференции EVA'2000). http://www.artinfo.ru/eva/EVA'2000M/EVA-papers/default.htm
http://www.indecs.org/pdf/Summary/Report/pdf
Каспарова Н.Н. Российская база метаданных и унификация библиографического описания электронных ресурсов. http://www.gpntb.ru/win/inter-events/crimea2000/doc/tom1/888/Doc6.HTML
Кузнецов С.В. Анализ проекта “Глобальная служба поиска информации” в контексте российских и глобальных проблем. Материалы российско-американского семинара, октябрь 2000.
Поляк Ю.Е. Каталоги российского Интернета (интервью А.Костинскому для радио “Свобода”). http://www.svoboda.org/programs/SC/2000/SC0822.shtml
Поляк Ю.Е. “АУ!” — первый миллион посещений. http://osp.ru/school/1998/4/09.htm
Руш-Фейа Д. Международные инициативы в области метаданных — последние достижения. http://www.rsl.ru/tacis/2000/200004/rusch-feja/rusch-feja.ru.html
Шварцман М.Е., Ильин А.С. Dublin Core в коробке. http://www.iis.ru/el-bib/2000/200002/SI/si.ru.html
Шварцман М.Е. Метаданные и Интернет. http://www.iis.ru/events/19990616/shvar.ru.html
Arms W.Y. Digital Libraries (перевод Арнаутова С.А.)
Day M. Metadata — Mapping between metadata. http://www.ukoln.ac.uk/metadata/interoperability/
Dublin Core Metadata for Resource Discovery — RFC 2413. http://www.faqs.org/rfcs/rfc2413.html; текстовая версия http://www.faqs.org/rfc/rfc2413.txt
Dublin Core Qualifiers (DCMI recommendation, 2000-07-11). http://purl.org/dc/documents/rec/dcmes-qualifiers-20000711.htm
GILS — Frequently Asked Questions. http://geolibr.uiggm.nsc.ru/docs/z39.50/gils/gils_faq.htm
Heery R. Review of Metadata Formats. http://ukoln.bath.ac.uk/metadata/review.html
Rust G. Metadata: The Right Approach. http://www.dlib.org/dlib/july98/rust/07rust.html
SCHEMAS Registry. http://www.schemas-forum.org/registry/registry.html

1 Лапо П.М., Соколов А.В. Введение в электронные библиотеки, 2005. http://natlib.org.by/html/news2005/7july/data/PDF.pdf, Антопольский А.Б. Системы метаданных в электронных библиотеках. - НТЦ “Информрегистр”, Москва, Россия, 2001. http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML

2 Лапо П.М., Соколов А.В. Введение в электронные библиотеки, 2005. http://natlib.org.by/html/news2005/7july/data/PDF.pdf, Антопольский А.Б. Системы метаданных в электронных библиотеках. - НТЦ “Информрегистр”, Москва, Россия, 2001. http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML

3 Лапо П.М., Соколов А.В. Введение в электронные библиотеки, 2005. http://natlib.org.by/html/news2005/7july/data/PDF.pdf, Антопольский А.Б. Системы метаданных в электронных библиотеках. - НТЦ “Информрегистр”, Москва, Россия, 2001. http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML

4 Антопольский А.Б. Системы метаданных в электронных библиотеках. - НТЦ “Информрегистр”, Москва, Россия, 2001. http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML

5 Антопольский А.Б. Системы метаданных в электронных библиотеках. - НТЦ “Информрегистр”, Москва, Россия, 2001. http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML, Каспарова Н.Н. Российская база метаданных и унификация библиографического описания электронных ресурсов. http://www.gpntb.ru/win/inter-events/crimea2000/doc/tom1/888/Doc6.HTML, Бейкер Т., Лагозе К. Стандарты и метаданные (практикум IFLA/DELOS/NSF в рамках конференции EVA'2000). http://www.artinfo.ru/eva/EVA'2000M/EVA-papers/default.htm, Шварцман М.Е., Ильин А.С. Dublin Core в коробке. http://www.iis.ru/el-bib/2000/200002/SI/si.ru.html, Шварцман М.Е. Метаданные и Интернет. http://www.iis.ru/events/19990616/shvar.ru.html, Arms W.Y. Digital Libraries (перевод Арнаутова С.А.)

6 Rust G. Metadata: The Right Approach. http://www.dlib.org/dlib/july98/rust/07rust.html

7 GILS — Frequently Asked Questions. http://geolibr.uiggm.nsc.ru/docs/z39.50/gils/gils_faq.htm

8 см. http://www.loc.gov/marc/dccross.html

9 см. http://www.gils.net/prof_v2.html#annex_b

10 Кузнецов С.В. Анализ проекта “Глобальная служба поиска информации” в контексте российских и глобальных проблем. Материалы российско-американского семинара, октябрь 2000.

Рекомендации по выбору систем метаданных для электронной библиотеки

Содержание

Введение

1. Сущность понятие «метаданные», группы и типы метаданных

2. Основные системы метаданных

3. Сопоставительный анализ Дублинского ядра и других систем метаданных

Заключение

Список литературы

Другие похожие работы