creator greenstone@cs.waikato.ac.nz public true acquire OAI -src rocky.dlib.vt.edu/~jcdlpix/cgi-bin/OAI1.1/jcdlpix.pl -getdoc indexes document:ex.dc.Description #levels document #defaultlevel document plugin OAIPlugin -default_language en -document_field ex.dc.Identifier -input_encoding iso_8859_1 plugin ImagePlugin -screenviewsize 300 -OIDtype assigned -OIDmetadata ex.dc.Title plugin GreenstoneXMLPlugin plugin MetadataXMLPlugin plugin ArchivesInfPlugin plugin DirectoryPlugin classify AZCompactList -metadata ex.dc.Subject -buttonname Subjects -doclevel top classify AZCompactList -mingroup 10 -metadata ex.dc.Description -mincompact 5 -minnesting 7 -buttonname Captions -maxcompact 10 format VList "
[screenicon] | |
_Caption_: | [ex.dc.Description] (_original_ [ImageWidth]x[ImageHeight] [ImageType] _available_) |
_Subject_: | [ex.dc.Subject] |
_Publisher_: | [ex.dc.Publisher] |
_Rights_: | [ex.dc.Rights] |
The collection configuration file includes an acquire line that is interpreted by a special program called importfrom.pl. Like other Greenstone programs, this takes as argument the name of the collection, and provides a summary of other arguments when invoked with argument -help. It reads the collection configuration file, finds the acquire line, and processes it. In this case, it is run with the command:\n
importfrom.pl oai-e\n
(the collection\'s name is oai-e). The acquire line in the configuration file specifies the OAI protocol and gives the base URL of an OAI repository. The importfrom program downloads all the metadata in that repository into the collection\'s import directory. The getdoc argument instructs it to also download the collection\'s source documents, whose URLs are given in each document\'s Dublin Core Identifier field (this is a common convention). The metadata files, which each contain an XML record for one source document, are placed in the import file structure along with the documents themselves, and the document filename is the same as the filename in the URL. The Identifier field is overridden to give the local filename, and its original value is retained in a new field called OrigURL.\n
Here is an example of a downloaded metadata file.\n
Once the OAI information has been imported, the collection is processed in the usual way. Besides the four standard plugins (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin and DirectoryPlugin), the configuration file specifies the OAI plugin, which processes OAI metadata, and the image plugin, because in this case the collection\'s source documents are image files. The OAI plugin has been supplied with an input_encoding argument because data in this archive contains extended characters. It also has a default_language argument. Greenstone normally determines the language of documents automatically, but these metadata records are too small for this to be done reliably: hence English is specified explicitly in the language argument. The OAI plugin parses the metadata and passes it to the appropriate source document file, which is then processed by an appropriate plugin -- in this case ImagePlugin. This plugin specifies the resolution for the screen versions of the images.\n
Extracted metadata from OAI records are mapped to Dublin Core Metadata Set by default. As a result, classifiers and indexes in this collection are built with Dublin meatadata elements.
The collection configuration file has a single full-text index containing dc.Description metadata. When a document is displayed, the DocumentHeading format statement puts out its dc.Subject. Then the DocumentText statement follows this with screenicon, which is produced by ImagePlugin and gives a screen-resolution version of the image; it is hyperlinked to the dc.OrigURL metadata -- that is, the original version of the image on the remote OAI site. This is followed by the image\'s dc.Description, also with a hyperlink; the image\'s size and type, again generated as metadata by ImagePlugin; and then dc.Subject, dc.Publisher, and dc.Rights metadata. This is the result.\n
There are two browsing classifiers, one based on dc.Subject metadata and the other on dc.Description metadata (but with a button named \"captions\"). Recall that the AZCompactList classifier is like AZList but generates a bookshelf for duplicate items. In this collection there are a lot of images but only a few different values for dc.Subject metadata.\n
It\'s a little surprising that AZCompactList is used (instead of AZList) for the dc.Description index too, because dc.Description metadata is usually unique for each image. However, in this collection the same description has occasionally been given to several images, and some of the divisions in an AZList would contain a large number of images, slowing down transmission of that page. To avoid this, the compact version of the list is used with some arguments (mincompact, maxcompact, mingroup, minnesting) to control the display -- e.g. groups (represented by bookshelves) are not formed unless they have at least 5 (mingroup) items. To find out the meaning of the other arguments for this classifier, execute the command classinfo.pl AZCompactList. The programs classinfo.pl (for classifiers) and pluginfo.pl (for plugins) are useful tools for learning about the capabilities of Greenstone modules. Note incidentally the backslash in the configuration file, used to indicate a continuation of the previous line.\n
The VList format specification shows the image thumbnail, hyperlinked to the associated document, followed by dc.Description metadata; the result can be seen here. The Vlists for the classifiers use numleafdocs to switch between an icon representing several documents (which will appear as a bookshelf) and the thumbnail itself, if there is only one image.\n
Greenstone comes with a built-in OAI data provider. This runs as a CGI program called \"oaiserver.cgi\", and is installed in the Greenstone cgi-bin directory. It can be accessed via the same URL as the Greenstone library (replacing \"library.cgi\" with \"oaiserver.cgi\"). If you are using the Windows local library server, you must install a web server (such as Apache) to run the OAI server.\n
Configuration of the server is done via the oai.cfg file in the Greenstone etc directory. This file specifies general information about the repository, and lists collections to be made accessible to OAI clients. By default, collections are not accessible. To enable a collection, add its name to the oaicollection list. Collections built with versions of Greenstone earlier than 2.52 must be rebuilt before they can be served.\n
Greenstone's OAI server currently supports Dublin Core, qualified Dublin Core and rfc1807 metadata sets. The oaimetadata line specifies which sets should be used. For collections that use other metadata sets, metadata mapping rules should be provided to map the existing metadata to the sets in use. See the oai.cfg file for details.\n " # -- French text ---------------- collectionmeta collectionextra [l=fr] " Cette collection montre la fonctionnalité ImportFrom de Greenstone. Par le biais de Open Archive Protocol (version 1.1), elle récupère des méta-données de rocky.dlib.vt.edu/~jcdlpix, une collection de photos prise lors de la cérémonie inaugurale de Joint Conference on Digital Libraries. Une collection Greenstone est créée à partir d'articles exportés du pourvoyeur de données OAI. L'implémentation est assez flexible pour s'accomoder des différences négligeables de syntaxes entre OAI 1.1 et OAI 2.0.
Le fichier de configuration de la collection comprend une ligne acquire (acquérir) qui est interprétée par un programme spécial appelé importfrom.pl. A l'instar des autres programmes Greenstone, celui-ci prend comme argument le nom de la collection et fournit un résumé des autres arguments quand ils sont appelés avec l'argument -help. Il lit le fichier de configuration de la collection, trouve la ligne acquire et en fait le traitement. Dans ce cas, il démarre avec la commande:
importfrom.pl oai-e
(le nom de la collection est oai-e). La ligne acquire dans le fichier de configuration spécifie le protocole OAI et donne l'URL de base d'un répertoire OAI. Le programme importfrom télécharge toutes les méta-données de ce entrepôt dans le dossier import de la collection. L'argument getdoc lui donne les instructions de télécharger aussi les documents sources de la collection dont les URL sont données dans le champ Dublin Core Identifier (Identificateur) de chaque document (ceci est une convention générale). Les fichiers de méta-données, dont chacun contient un enregistrement XML pour un document source, sont placés dans la structure de fichiers import avec les documents eux-mêmes, et le nom de fichier du document est le même que le nom de fichier dans l'URL. Le champ Identifier est écrasé pour donner le nom de fichier local et sa valeur originale est retenue dans le nouveau champ appelé OrigURL.
Voici un exemple de fichier de méta-données téléchargé.
Une fois que l'information OAI a été importée, la collection est traitée de façon usuelle. Le fichier de configuration précise le plugin OAI, qui traite la méta-donnée OAI et le plugin de l'image, car dans ce cas les documents source de la collection sont des fichiers d'images. En plus des quatre plugiciels de base (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin and DirectoryPlugin), le fichier de configuration détermine le comportement du plugiciel OAI, qui traite les métadonnées OAI, ainsi que celui du plugiciel Image, puisque dans ce cas, les documents sources de la collection sont des fichiers images. Il a aussi un argument default_language. Normalement, Greenstone détermine automatiquement la langue des documents, mais ces enregistrements de méta-données sont très insuffisants pour que ceci soit fait de manière fiable: dès lors, l'anglais est spécifié explicitement dans l'argument language. Le plugin OAI analyse la méta-donnée et la transmet au fichier du document source approprié, qui est ainsi traité par un plugin approprié --- dans ce cas-ci par ImagePlugin. Ce plugin spécifie la résolution pour les versions écran des images.
Par défaut, les métadonnées extraites d'enregistrements OAI sont converties en métadonnées Dublin Core. Par conséquent, les classificateurs et les index de cette collection sont construits à partir des éléments de métadonnées Dublin Core.
Le fichier de configuration de la collection a un index \"full-text\" unique contenant la méta-donnée dc.Description. Quand un document est affiché, la déclaration de format DocumentHeading révèle son dc.Subject (Sujet). Elle est ensuite suivie de la déclaration DocumentText avec screenicon produit par ImagePlugin et qui donne une version résolution d'écran de l'image; elle est liée à la méta-donnée dc.OrigURL, c'est à dire la version originale de l'image sur le site OAI distant. Elle est suivie par dc.Description de l'image, aussi avec un lien; le type et la taille de l'image, générés également comme méta-données par ImagePlugin; et enfin les méta-données dc.Subject, dc.Publisher et dc.Rights. Voici le résultat.
Il y a deux classificateurs de navigation, l'un basé sur la méta-donnée dc.Subject et l'autre sur la méta-donnée dc.Description (mais avec un bouton dénommé \"légends\"). On rappelle que le classificateur AZCompactList est identique à AZList mais produit un rayon pour dupliquer les articles. Cette collection contient plusieurs images mais seulement peu de valeurs différentes pour la méta-donnée dc.Subject.
C'est un peu surprenant que AZCompactList soit utilisé (au lieu de AZList) pour l'index dc.Description aussi, car la méta-donnée dc.Description est usuellement unique pour chaque image. Cependant, dans cette collection, la même description a été occasionnellement donnée à plusieurs images, et certaines des divisions dans AZList contiendraient un grand nombre d'images, ralentissant la transmission de cette page. Pour éviter cela, la version compact de la liste est utilisée avec quelques arguments (mincompact, maxcompact, mingroup, minnesting) pour contrôler l'affichage ' c'est à dire des groupes (représentés par les rayons de bibliothèque) ne sont formés qu'à condition qu'il aient au moins cinq éléments (mingroup). Pour trouver la signification des autres arguments pour ce classificateur, il faut exécuter la commande classinfo.pl AZCompactList. Les programmes classinfo.pl (pour classificateurs) et pluginfo.pl (pour plugins) sont des outils précieux pour connaître les capacités des modules de Greenstone. Il faut noter que le \"backslash\" (\\\\) dans le fichier de configuration est généralement utilisé pour indiquer une continuation de la ligne précédente.
La spécification du format Vlist montre l'onglet de l'image, lié (hyperlien) au document associé, suivi de la méta-donnée dc.Description; le résultat peut être vu ici. Vlist pour les classificateurs utilise numleafdocs pour commuter d'une icône représentant plusieurs documents (ce qui apparaîtra dans le rayon de livres) à l'onglet lui-même, si une seule image est présente.
Greenstone inclus un fournisseur de donné de type OAI. Il fonctionne par le biais d'un programme CGI nommé \"oaiserver.cgi\" lequel se trouve dans le fichier cgi-bin de Greenstone. On peut y accéder au moyen de la même URL que la librairie de Greenstone (en remplacant \"library.cgi\" par \"oaiserver.cgi\"). Si vous utilisez le serveur local de librairie de windows, vous devez installer un serveur internet (tel qu'Apache) pour pouvoir utiliser ce serveur OAI.
La configuration du serveur est réalisée au moyen du fichier oai.cfg se trouvant dans le dossier etc de Greenstone. Ce fichier spécifie des informations générales sur le dossier et fait la liste des collections à rendre accessibles aux clients OAI. Par défaut, les collections ne sont pas accéssibles. Afin de rendre une collection accessible, ajoutez son nom à la liste oaicollection. Les collections construites avec des version de Greenstone antérieures à la version 2.52 doivent être recompilée avant de pouvoir être utilisée par le serveur.
A ce jour, le serveur OAI de Greenstone gère les jeux de métadonnées Dublin Core, Dublin Core qualifié, et rfc1807. La ligne oaimetadata définit les jeux de métadonnées à utiliser. Pour les collections utilisant d'autres jeux de métadonnées, des règles de correspondance des métadonnées peuvent être ajoutées pour faire correspondre les métadonnées existantes avec les jeux disponibles. Voir le fichier oai.cfg pour plus d'informations. \n " # -- Spanish text ---------------- collectionmeta collectionextra [l=es] " Esta colección demuestra la función ImportFrom de Greenstone. Por medio del Protocolo de Archivo Abierto (versión 1.1) recupera metadatos de rocky.dlib.vt.edu/~jcdlpix, una colección de fotografías tomadas durante la Conferencia inaugural conjunta de Bibliotecas Digitales. Se creó una colección Greenstone a partir de los registros exportados por este proveedor de datos OAI. La implementación es lo suficientemente flexible para enfrentar diferencias menores de sintaxis entre OAI 1.1 y OAI 2.0.
importfrom.pl oai-e\n
(donde el nombre de la colección es oai-e). La línea acquire en el archivo de configuración especifica el protocolo OAI y proporciona el URL base de un repositorio OAI. El programa importfrom baja todos los metadatos del repositorio en el directorio importar de la colección. El argumento getdoc lo instruye también para que baje los documentos fuente de la colección, cuyos URLs están dados en el campo Identificador de Dublin Core de cada documento (ésta es una convención). Los archivos de metadatos, cada uno de los cuales contiene un registro XML para un documento fuente, se colocan en la estructura de archivos importar junto con los documentos mismos y el nombre de archivo del documento es igual al nombre de archivo en el URL. El campo Identificador se sustituye por el nombre de archivo local y su valor original es conservado en un nuevo campo llamado OrigURL.
He aquí un ejemplo de un archivo de metadatos bajados del repositorio.
Una vez que la información OAI se ha importado, la colección se procesa de forma normal. Además de los cuatro plugins estándar (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin y DirectoryPlugin), el archivo de configuración especifica al plugin OAI, el cual procesa metadatos OAI, y también el plugin para imágenes, porque en este caso los documentos fuente de la colección son imágenes. El plugin OAI tiene una opción llamada input_encoding porque los datos del archivo contienen caracteres extendidos. También tiene un argumento default_language. Normalmente Greenstone determina el idioma de los documentos automáticamente, pero estos registros de metadatos son demasiado pequeños para poder hacerlo de manera confiable, por lo que el inglés se especifica de manera explícita en el argumento language. El plugin OAI descompone y analiza los metadatos y los pasa al correspondiente archivo de documento fuente, el cual es procesado a continuación por un plugin apropiado, que en este caso es ImagePlugin. Este plugin especifica la resolución de las imágenes en pantalla.
Los metadatos extractados de registros OAI son mapeados al esquema de metadatos Dublin Core por defecto. Como resultado, los clasificadores y los índices en esta colección son construídos con elementos de metadatos Dublin Core.
El archivo de configuración de la colección tiene un solo índice de texto completo, el cual contiene el metadato dc.Descripción. Cuando un documento se despliega en pantalla el enunciado de formato DocumentHeading muestra su dc.Asunto. A continuación le sigue el enunciado DocumentText con screenicon, el cual es producido por ImagePlugin y proporciona una versión en pantalla de la imagen. Ésta cuenta con un hipervínculo al metadato dc.OrigURL, es decir, a la versión original de la imagen en el sitio OAI remoto. Le sigue la dc.Descripción de la imagen, también con un hipervínculo, el tamaño y tipo de la imagen, nuevamente generados como metadatos por ImagePlugin, y finalmente los metadatos de dc.Asunto, dc.Editorial y dc.Derechos de Autor. Éste es el resultado.
Existen dos clasificadores de exploración, uno basado en el metadato dc.Asunto y el otro en el metadato dc.Descripción (pero con un botón llamado \"pies de foto\"). Recuerde que el clasificador AZCompactList es como AZList, pero genera un estante para los ítems duplicados. En esta colección hay una gran cantidad de imágenes, pero sólo unos cuantos valores diferentes para el metadato dc.Asunto.
Resulta un tanto sorprendente que el clasificador AZCompactList también se utilice (en vez de AZList) para el índice de dc.Descripción, ya que por lo general el metadato dc.Descripción es exclusivo para cada imagen. Sin embargo, en esta colección la misma descripción se emplea en ocasiones para varias imágenes, por lo que algunas de las divisiones en una AZList contendrían un gran número de imágenes, haciendo que la transmisión de esa página fuera más lenta. Para evitarlo se utiliza la versión compacta de la lista con algunos argumentos (mincompact, maxcompact, mingroup, minnesting) para controlar la presentación en pantalla. Por ejemplo, los grupos (representados por estantes) no se forman a menos que tengan al menos 5 (mingroup) ítems. A fin de conocer el significado de los otros argumentos para este clasificador ejecute el comando classinfo.pl AZCompactList. Los programas classinfo.pl (para los clasificadores) y pluginfo.pl (para los plugins) son herramientas sumamente útiles para conocer las funciones de los módulos Greenstone. Fíjese además en la barra de directorios en el archivo de configuración, usada para indicar la continuación de la línea anterior.
La especificación de formato VList muestra la miniatura de la imagen con hipervínculos al documento asociado, seguida por el metadato dc.Description. El resultado se puede ver aquí. Las Vlists para los clasificadores utilizan numleafdocs para cambiar entre un icono que representa varios documentos (el cual aparecerá como un estante) y la miniatura, si sólo hay una imagen.
Greenstone incorpora un servidor/proveedor de datos OAI. Se ejecuta mediante un programa CGI llamado \"oaiserver.cgi\", y se encuentra en el directorio cgi-bin de Greenstone. Se accede a él utilizando el mismo URL que para la biblioteca Greentone (reemplazando \"library.cgi\" por \"oaiserver.cgi\"). Si usted está usando el servidor de biblioteca local, debe instalar un servidor web (como Apache) para poder ejecutar el servidor OAI.\n
La configuración del servidor se hace mediante el archivo oai.cfg que se encuentra en el directorio etc de Greenstone. Este fichero especifica la información general sobre el repositorio, e incluye un listado de las colecciones accesibles para los clientes OAI. En principio, las coleccciones no son accesibles. Para permitir el acceso a una colección, añada su nombre a la lista oaicollection. Las colecciones construidas con versiones de Greenstone anteriores a la 2.52 deben ser reconstruidas antes de que puedan ser accesibles.\n
El servidor OAI de Greenstone actualmente soporta Dublin Core, qualified Dublin Core y rfc1807. La línea oaimetadata especifica qué conjuntos deberían ser usados. Para las colecciones que usan otros conjuntos de metadatos, deben indicarse reglas de mapeo de metadatos para asociar los metadatos existentes con los esquemas utilizados. Vea el archivo oai.cfg para mayores detalles.\n " # -- Russian text ---------------- collectionmeta collectionextra [l=ru] " Эта коллекция демонстрирует особенности ImportFrom Greenstone, используя Открытый Архивный Протокол OAI (версия 1.1). Она восстанавливает метаданные из rocky.dlib.vt.edu/~jcdlpix, коллекцию фотографий, полученных при инаугурации Объединенной Конференции по Цифровым Библиотекам. Коллекция Greenstone построена по записям, экспортированным из этого OAI поставщика данных. Инструмент является достаточно гибким, чтобы справиться с незначительными синтаксическими различиями между версиями OAI 1.1 и OAI 2.0.
importfrom.pl oai-e\n где oai-e - имя коллекции.
Строка acquire в конфигурационном файле задает протокол OAI и выдает базовый адрес URL хранилища OAI. Программа importfrom выгружает все метаданные этого хранилища в директорию коллекции import. Параметр getdoc даёт команду выгружать документы из исходной коллекции, чьи URL приводятся в каждом поле документа идентификатора Dublin Core (это -- общее соглашение). Файлы метаданных, каждый из которых содержит XML-запись одного исходного документа, помещены в структуру файла import наряду с самими документами, и имя файла документа такое же, что и файла в URL. Поле Identifier переопределено, чтобы дать локальное имя файлу, а его первоначальное значение сохраняется в новом поле по имени dc.OrigURL.
Здесь показан пример разгрузки файла метаданных.
Как только информация из ОAI импортирована, коллекция обрабатывается обычным способом. Конфигурационный файл определяет плагин OAI, который обрабатывает метаданные OAI, и плагин изображений, поскольку в этом случае документы исходной коллекции - это файлы изображений. Besides the four standard plugins (GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin and DirectoryPlugin), the configuration file specifies the OAI plugin, which processes OAI metadata, and the image plugin, because in this case the collection\'s source documents are image files. Greenstone обычно определяет язык документов автоматически, но эти записи метаданных являются слишком небольшими для того, чтобы это сделать надежно: поэтому английский язык определен явно в параметре языка (language). Плагины ОAI анализируют метаданные и пересылают их к соответствующему файлу исходного документа, который затем обрабатывается соответствующим плагином -- в данном случае ImagePlugin. Этот плагин определяет различные версии разрешения изображения на экране.
Extracted metadata from OAI records are mapped to Dublin Core Metadata Set by default. As a result, classifiers and indexes in this collection are built with Dublin meatadata elements.
The collection configuration file has a single full-text index containing dc.Description metadata. When a document is displayed, the DocumentHeading format statement puts out its dc.Subject. Then the DocumentText statement follows this with screenicon, which is produced by ImagePlugin and gives a screen-resolution version of the image; it is hyperlinked to the dc.OrigURL metadata -- that is, the original version of the image on the remote OAI site. This is followed by the image\'s dc.Description, also with a hyperlink; the image\'s size and type, again generated as metadata by ImagePlugin; and then dc.Subject, dc.Publisher, and dc.Rights metadata. This is the result.\n
Имеется два классификатора просмотра, один из которых основан на метаданных Предмета, а другой -- на метаданных Описания, но с иконкой, названной «Заголовки». Вспомните, что классификатор AZCompactList похож на AZList, но производит книжную полку для дубликатов элементов. В этой коллекции имеется много изображений, но лишь несколько из них имеют различные значения для метаданных Предмета.
Можно удивляться, что AZCompactList используется вместо AZList также для индекса Описания (dc.Description), потому что метаданные Описания обычно уникальны для каждого изображения. Однако в данной коллекции одно и то же описание иногда давалось нескольким изображениям, и некоторые из разделов AZList содержат большое число изображений, замедляя передачу этой страницы. Чтобы избежать этого, используется компактная версия списка с рядом параметров (mincompact, maxcompact, mingroup, minnesting), чтобы управлять показом -- Например, группы, (представленные книжными полками), не сформируются до тех пор, пока они не будут иметь по крайней мере 5 элементов (mingroup). Чтобы узнать значения других параметров для этого классификатора, выполните команду classinfo.pl AZCompactList. Программы classinfo.pl (для классификаторов) и pluginfo.pl (для плагинов) являются полезными инструментами, когда надо узнать о возможностях модулей Гринстоун. Обратите кстати внимание на обратный слеш в конфигурационном файле, используемый для указания на продолжение предыдущей строки.\n
Определение формата VList показывает уменьшенное изображение, имеющее гиперсвязь с исходным документом, в соответствии с метаданными Описания; результат чего можно видеть здесь. Vlists для классификаторов использует numleafdocs для переключения между иконками, представляющими несколько документов (который появится в виде книжной полки), и непосредственно уменьшенное изображение, если оно только одно.
Greenstone отличается встроенным OAI поставщиком данных. Это запускается как CGI программа, называемая \"oaiserver.cgi\", и установлена в cgi-bin директории Greenstone. К этому можно обратиться через то же самый URL как библиотека Greenstone (заменяющий \"library.cgi\" с \"oaiserver.cgi\"). Если Вы используете Windows локальный сервер библиотеки, Вы должны установить web сервер (такой как Apache), чтобы управлять OAI сервером.
Конфигурация сервера сделана через oai.cfg файл в директории Greenstone. Этот файл определяет главную информацию о системе хранения, и списках коллекций, которые будут доступны для OAI клиентов. По умолчанию, коллекции не доступны. Чтобы включить колекцию, добавьте это название(имя) к списку oaicollection. Коллекции построенные с версиями Greenstone ранее чем 2.52 должны быть перестроены прежде они могут обслуживаться.
Greenstone's OAI server currently supports Dublin Core, qualified Dublin Core and rfc1807 metadata sets. The oaimetadata line specifies which sets should be used. For collections that use other metadata sets, metadata mapping rules should be provided to map the existing metadata to the sets in use. See the oai.cfg file for details.\n " # -- Simplified Chinese text ---------------- collectionmeta collectionextra [l=zh] " 本馆藏演示Greenstone的ImportFrom(导入)功能。通过使用 Open Archive Protocol(开放式存储协议)(1.1版),Greenstone从 rocky.dlib.vt.edu/~jcdlpix检索元数据。这是一个关于照片的馆藏,这些照片 摄于Joint Conference on Digital Libraries(数字图书馆联合会员)。 在从OAI数据提供者导出的记录的基础上,构建一个Greenstone馆藏。这里的实现机制可以灵活地 处理OAI 1.1与OAI 2.0之间细微的语法差别。\n
本馆藏的配置文件包含一行acquire, 这一行将由一个特别的程序importfrom.pl处理。与其他Greenstone程序类似,馆藏的名字将作为参数, 而输入-help参数将显示其他参数的描述。该文件读入馆藏的配置文件,找到获取(acquire)行,并对其 进行处理。此时它将运行以下命令\n
importfrom.pl oai-e\n
(馆藏的名字是oai-e)。 配置文件中的acquire行指定了OAI协议并给出了OAI存储的基准URL。importfrom程序 下载该存储中的所有元数据并保存到馆藏的import目录。getdoc参数指定同时下载馆藏的 源文档,而源文档的URL在文档都柏林核心元数据字段Identifier(标识符)中定义(这是约定俗成的 设置)。每个元数据文件包含一个源文档的XML记录,这些元数据文件以及其源文件都保存在import 文件目录中,而且源文档的文件名与URL中的文件名相同。标识符(Identifier)字段将被本地文件名重写, 而其原始的值被保留在一个新的字段中:OrigURL字段。\n
这里是一个已下载的元数据文件范例。\n
一旦OAI信息被成功导入,该馆藏将按通常的方式处理。在四个标准的插件 (GreenstoneXMLPlugin、MetadataXMLPlugin、ArchivesInfPlugin与DirectoryPlugin)之外, 配置文件还指定了用于处理OAI元数据的OAI插件,以及图片插件,因为此时馆藏的源文档是 图片文件。OAI插件有一个input_encoding参数,因为本馆藏中包含扩展字符集。 它还有一个default_language参数。Greenstone通常会自动判断文档的语种,但是这些元数据记录 太小,不适合自动语种判断,因此用language参数来明确指定语种为英语。OAI插件处理这些元数据 并将其传递给合适的源文档文件,而该文档文件又将被合适的插件所处理——此时是ImagePlugin。 图像插件设置了图片屏幕版本的分辨率。\n
缺省情况下,从OAI记录中抽取出的元数据将被映射到都柏林核心元数据集。 因此,馆藏中的分类器与索引都将基于都柏林元数据元素构建。
本馆藏的配置文件 只有一个包含了dc.Description(描述)元数据的全文索引。当显示一个文档时, DocumentHeading格式变量首先显示其dc.Subject。接下来其后的DocumentText 变量中的screenicon给出了屏幕分辨率版本的图片,screenicon由ImagePlugin创建, 且在此链接到dc.OrigURL元数据——也就是说,远程OAI网站上的原始版本图片。接下来是该图片的 dc.Description,同样也有一个链接,图片的大小与类型,同样也是由ImagePlugin生成的元数据; 以及然后的dc.Subject、dc.Publisher和dc.Rights元数据。 这里是格式后的例子。\n
这里有两个浏览分类器,一个以dc.Subject元数据为基础,另一个以dc.Description元数据为基础(但它对应的按钮名 为\"标题\")。AZCompactList分类器与AZList相似,但会为重复条目创建一个书架。这个馆藏有很多图片,但只有几个不同的 dc.Subject元数据值。\n
AZCompactList的使用(而不是AZList)让人感到有点惊讶,同样的对于dc.Description索引,因为dc.Description 元数据通常对每个图片都是唯一的。然而,在这个馆藏中,有时候多个图片有着同一个描述,因此 AZList中的一些分组将包含很多图片, 这降低了页面的传输速度。为了避免这一点,这里使用列表的压缩版,并为其设置了一些参数(mincompact、maxcompact、 mingroup、minnesting)来控制显示——比如只有在超过5个条目(mingroup)的情况下创建分组(显示为书架)。若要了解 本分类器其他选项的含义,可执行classinfo.pl AZCompactList命令。classinfo.pl程序(对于分类器)和pluginfo.pl程序(对于插件 ) 是了解Greenstone模块功能的由于工具。请注意配置文件中的反斜线,它们说明本行与前一行是一体的。
VList格式指定显示图片的缩略图,并链接到与之对应的文档上,接着显示dc.Description元数据,如 这里所示。分类器的Vlists使用numleafdocs来在表示多个 文档的图标(即书架图标)与缩略图之间的切换,当只有一个图片时将显示缩略图。\n
Greenstone有一个内置的OAI数据提供者。这是由一个称为\"oaiserver.cgi\"的CGI程序运行,并安装 在Greenstone的cgi-bin目录中。它可通过与Greenstone图书馆相同的URL来访问(将\"library.cgi\"替换成\"oaiserver.cgi\")。如果你使用的 是Windows本地服务器,则你必须安装一个web服务器(比如Apache)才能运行OAI服务器。\n
服务器的配置是通过Greenstoneetc目录下的oai.cfg文件完成的。 这个文件设置了存储的基本信息,并列出了OAI客户端可访问的馆藏。缺省情况下,馆藏是不可访问的。 要使某个馆藏可通过OAI访问,将其名称添加到oaicollection列表中。Greenstone 2.52之前版本构建的馆藏 必须在重新构建之后才可提供服务。\n
服务器的配置是通过Greenstoneetc目录下的oai.cfg文件完成的。 这个文件设置了存储的基本信息,并列出了OAI客户端可访问的馆藏。缺省情况下,馆藏是不可访问的。 要使某个馆藏可通过OAI访问,将其名称添加到oaicollection列表中。Greenstone 2.52之前版本构建的馆藏 必须在重新构建之后才可提供服务。\n
Greenstone的OAI服务器目前支持都柏林核心元数据,限定性都柏林核心元数据以及rfc1807元数据集。 oaimetadata行指定应被使用的元数据集。对于使用其他元数据集的馆藏,应该提供元数据映射规则将 现有的元数据映射到使用的元数据集上。详细信息请参见oai.cfg文件。\n "