name=OAI演示馆藏 Rights=版权 Caption=标题 Publisher=出版商 Subject=主题 original=原始 available=可用 index_Description=照片标题 description1a=

本馆藏演示Greenstone的ImportFrom(导入)功能。通过使用 Open Archive Protocol(开放式存储协议)(1.1版),Greenstone从 rocky.dlib.vt.edu/~jcdlpix检索元数据。这是一个关于照片的馆藏,这些照片 摄于Joint Conference on Digital Libraries(数字图书馆联合会员)。 在从OAI数据提供者导出的记录的基础上,构建一个Greenstone馆藏。这里的实现机制可以灵活地 处理OAI 1.1与OAI 2.0之间细微的语法差别。

description1=

本馆藏如何工作

本馆藏的配置文件包含一行acquire, 这一行将由一个特别的程序importfrom.pl处理。与其他Greenstone程序类似,馆藏的名字将作为参数, 而输入-help参数将显示其他参数的描述。该文件读入馆藏的配置文件,找到获取(acquire)行,并对其 进行处理。此时它将运行以下命令

 importfrom.pl oai-e 
(馆藏的名字是oai-e)。

description2=

配置文件中的acquire行指定了OAI协议并给出了OAI存储的基准URL。importfrom程序 下载该存储中的所有元数据并保存到馆藏的import目录。getdoc参数指定同时下载馆藏的 源文档,而源文档的URL在文档都柏林核心元数据字段Identifier(标识符)中定义(这是约定俗成的 设置)。每个元数据文件包含一个源文档的XML记录,这些元数据文件以及其源文件都保存在import 文件目录中,而且源文档的文件名与URL中的文件名相同。标识符(Identifier)字段将被本地文件名重写, 而其原始的值被保留在一个新的字段中:OrigURL字段。

description3=

collect/oai-e/etc/oai.txt是一个已下载的元数据文件范例。

description4=

一旦OAI信息被成功导入,该馆藏将按通常的方式处理。在四个标准的插件 (GreenstoneXMLPlugin、MetadataXMLPlugin、ArchivesInfPlugin与DirectoryPlugin)之外, 配置文件还指定了用于处理OAI元数据的OAI插件,以及图片插件,因为此时馆藏的源文档是 图片文件。OAI插件有一个input_encoding参数,因为本馆藏中包含扩展字符集。 它还有一个default_language参数。Greenstone通常会自动判断文档的语种,但是这些元数据记录 太小,不适合自动语种判断,因此用language参数来明确指定语种为英语。OAI插件处理这些元数据 并将其传递给合适的源文档文件,而该文档文件又将被合适的插件所处理——此时是ImagePlugin。 图像插件设置了图片屏幕版本的分辨率。

description5=

缺省情况下,从OAI记录中抽取出的元数据将被映射到都柏林核心元数据集。 因此,馆藏中的分类器与索引都将基于都柏林元数据元素构建。本馆藏的配置文件 只有一个包含了dc.Description(描述)元数据的全文索引。当显示一个文档时, DocumentHeading格式变量首先显示其dc.Subject。接下来其后的DocumentContent 变量中的screenicon给出了屏幕分辨率版本的图片,screeniconImagePlugin创建, 且在此链接到dc.OrigURL元数据——也就是说,远程OAI网站上的原始版本图片。接下来是该图片的 dc.Description,同样也有一个链接,图片的大小与类型,同样也是由ImagePlugin生成的元数据; 以及然后的dc.Subjectdc.Publisherdc.Rights元数据。 这里是格式后的例子。

description6=

这里有两个浏览分类器,一个以dc.Subject元数据为基础,另一个以dc.Description元数据为基础(但它对应的按钮名 为"标题")。AZCompactList分类器与AZList相似,但会为重复条目创建一个书架。这个馆藏有很多图片,但只有几个不同的 dc.Subject元数据值。

description7=

AZCompactList的使用(而不是AZList)让人感到有点惊讶,同样的对于dc.Description索引,因为dc.Description 元数据通常对每个图片都是唯一的。然而,在这个馆藏中,有时候多个图片有着同一个描述,因此 AZList中的一些分组将包含很多图片, 这降低了页面的传输速度。为了避免这一点,这里使用列表的压缩版,并为其设置了一些参数(mincompactmaxcompactmingroupminnesting)来控制显示——比如只有在超过5个条目(mingroup)的情况下创建分组(显示为书架)。若要了解 本分类器其他选项的含义,可执行classinfo.pl AZCompactList命令。classinfo.pl程序(对于分类器)和pluginfo.pl程序(对于插件 ) 是了解Greenstone模块功能的由于工具。请注意配置文件中的反斜线,它们说明本行与前一行是一体的。

description8=

VList格式指定显示图片的缩略图,并链接到与之对应的文档上,接着显示dc.Description元数据,如 这里所示。分类器的Vlists使用numleafdocs来在表示多个 文档的图标(即书架图标)与缩略图之间的切换,当只有一个图片时将显示缩略图。

description9=

Greenstone OAI服务器

Greenstone有一个内置的OAI数据提供者。这是由一个称为"oaiserver.cgi"的CGI程序运行,并安装 在Greenstone的cgi-bin目录中。它可通过与Greenstone图书馆相同的URL来访问(将"library.cgi"替换成"oaiserver.cgi")。如果你使用的 是Windows本地服务器,则你必须安装一个web服务器(比如Apache)才能运行OAI服务器。

description10=

服务器的配置是通过Greenstoneetc目录下的oai.cfg文件完成的。 这个文件设置了存储的基本信息,并列出了OAI客户端可访问的馆藏。缺省情况下,馆藏是不可访问的。 要使某个馆藏可通过OAI访问,将其名称添加到oaicollection列表中。Greenstone 2.52之前版本构建的馆藏 必须在重新构建之后才可提供服务。

description11=

服务器的配置是通过Greenstoneetc目录下的oai.cfg文件完成的。 这个文件设置了存储的基本信息,并列出了OAI客户端可访问的馆藏。缺省情况下,馆藏是不可访问的。 要使某个馆藏可通过OAI访问,将其名称添加到oaicollection列表中。Greenstone 2.52之前版本构建的馆藏 必须在重新构建之后才可提供服务。

description12=

Greenstone的OAI服务器目前支持都柏林核心元数据,限定性都柏林核心元数据以及rfc1807元数据集。 oaimetadata行指定应被使用的元数据集。对于使用其他元数据集的馆藏,应该提供元数据映射规则将 现有的元数据映射到使用的元数据集上。详细信息请参见oai.cfg文件。