infodbtype gdbm creator greenstone@cs.waikato.ac.nz maintainer greenstone@cs.waikato.ac.nz public true buildtype mgpp groupsize 200 indexes text metadata plugin BibTexPlugin -OIDtype assigned -OIDmetadata Number plugin GreenstoneXMLPlugin plugin MetadataXMLPlugin plugin ArchivesInfPlugin plugin DirectoryPlugin classify AZList -metadata Title classify AZCompactList -metadata Author -buttonname Creator classify DateList -metadata Date classify Phind -text document:Title,document:Creator,document:Booktitle,document:Publisher format SearchTypes "form,plain" format VList "
_AuthoredBy_: | [Creator] |
_PaperTitle_: | [Title] |
_Editors_: | [Editor] |
_EditorRole_: | [EditorRole] |
_BookJournalTitle_: | [Booktitle] |
_In_: | [Journal] |
} {If}{[Number], _Number_: | [Number]} {If}{[Volume], _Vol_: [Volume]} {If}{\\"[Volume][Number]\\", |
_MeetingDate_: | [MeetingDate] |
_MeetingPlace_: | [MeetingPlace] |
_PublicationPlace_: | [PublicationPlace] |
_Publisher_: | [Publisher] |
_PublicationDate_: | [Month] [Year] |
_Pages_: | [Pages] |
_DocType_: | [DocType] |
_LocationURL_: | [Location] |
_Annotations_: | [Notes] |
_Abstract_: | [Abstract] |
_Keywords_: | [Keywords] |
The collection configuration file begins with the specification groupsize 200. This groups 200 documents together into a single archive file. Bibliography collections typically have many small documents, and grouping them together prevents Greenstone\'s internal file structures from becoming bloated and occupying more disk space than necessary.\n
Apart from the standard plugins, this collection uses BibTexPlugin, which processes references in the BibTeX format (well known to computer scientists). Two options have been set for BibTexPlugin: -OIDtype assigned -OIDmetadata Number. This means the metadata element \"Number\" will be used as the record identifier, instead of Greenstone\'s default hash identifiers. These options are available for all plugins.\n
Fielded searching, with a form-based interface, is selected by format SearchTypes \"form,plain\" in the configuration file. In fact, a plain textual full-text search index is included in this collection as well (since form comes first, it is the default interface; you reach the plain search through the Preferences page).\n
The buildtype option shows that the default search engine mgpp is used. The indexes line specifies indexes for \"text\", and \"metadata\". In this case, \"text\" will be the original BibTeX record. \"metadata\" is a special keyword signifying that an index should be built for any metadata item found in the collection. Thus when the \"field\" menus in the search page are pulled down, they show full records followed by an entry for each metadata element. Collection-level metadata collectionmeta can be specified for any index to determine what it is called in the menu (except for metadata, which produces many menu items). In this case, the configuration file specifies that the text index should be named \"full records\" because it contains the original bibliographic record.\n
An additional keyword, \"allfields\", could also be used in the indexes line, specifying that combined searching over all indexes should be available.
The levels lines specifies only document level, as bibliographic records don\'t have internal structure.
This collection contains Title, Author, and Date browsers, and a special kind of phrase index called \"Phind.\" The AZCompactList classifier used for the Author browser is like AZList but generates a bookshelf for duplicate items as shown here. The BibTeX plugin records each author as Author metadata; it also puts a list containing all authors into the Creator metadata element. Consequently the AZCompactList classifier is based on Author. However, Greenstone has a standard button reading authors whose name is (confusingly) \"Creator\", so this button name is specified for the classifier.\n
The \"Phind\" classifier creates a phrase index like this. It contains a browsable list of phrases extracted from the material specified in the text argument of the classify Phind line in the configuration file. Here the specification is\n
document:Title,document:Creator,document:Booktitle,document:Publisher\n -- that is, the title, list of authors, title of the collected work (if any) in which this item appears, and publisher. Note that this specification follows the mg convention with level:field. Phind indexes are more usually based on the entire full text of a collection, using the specification document:text.\n
The best way to see what Phind does is to play with this index. You type a word in the search box, click Search, and a list of phrases containing that term appears in the top panel. Click on one of these phrases and a list of phrases containing that phrase appears in the bottom panel. You can continue doing this, expanding the phrase more and more. The lists can be lengthened using the get more phrases button. At the end of the list of phrases appears a list of documents containing that phrase, in blue text; you can lengthen this list by clicking get more documents.\n
The format statements for the search results list and the title browser are both determined by the VList specification. It gives a document icon that links to the document itself (which in this collection is the full reference); the title in bold; Creator metadata if there is any, otherwise Editor metadata; and Month, Year metadata if there is any. Here is an example.\n
The format statement for the author browser (CL2VList) is more complex. The AZCompactList classifier generates a tree whose nodes are either leaf nodes, representing documents, or internal nodes. A metadata item called numleafdocs gives the total number of documents below an internal node. This format statement checks whether numleafdocs exists. If so the node must be an internal node, in which case the node is labeled by its Title. But beware: this classifier is generated on Author metadata, so its title -- the title of the classifier -- is actually the author\'s name! This means that the bookshelf nodes here are labeled by author\'s name. The leaf nodes, however, are labeled the same way as documents (i.e. references) are in the search results list.\n
The documents themselves (here is an example) are generated by two format statements, one (a long one) called DocumentHeading, and another called DocumentText. The DocumentHeading, which is the top two-thirds of the page, contains the document\'s Title followed by a table that gives all the metadata elements that the BibTeX plugin can generate. The role of all the If statements in the configuration file is to determine which elements are defined.\n
The DocumentText shows the BibTeX version of the reference. However, when the document is displayed initially, only a hyperlink reading Show BibTex Record appears -- this corresponds to the last part (that is, the \"else\" part) of the If statement in DocumentText. When this hyperlink is clicked, the href goes to the same URL but with showrecord=1, which generates a page like this. The If test succeeds, which shows the Text of the document. With the BibTeX plugin, the text of a document is its unadulterated BibTeX record.\n " # -- French text ---------------- collectionmeta collectionextra [l=fr] " Cette collection qui contient des entrées _about:numdocs_ BibTex, est working papers éditées de 1997 à 2006 au Département d\'informatique, Université de Waikato.\n
Le fichier de configuration de la collection commence par la spécification groupsize 200. Cela rassemble 200 documents dans un seul fichier d\'archive. Les collections de bibliographies ont généralement beaucoup de petits documents; le fait de les regrouper empêche le gonflement des structures de fichiers internes et l\'occupation inutile d\'espace disque.
En plus des plugiciels standards, cette collection utilise BibTexPlugin, qui traite les références écrites au format BibTex (bien connu des informaticiens). Deux options ont été définies pour le plugiciel BibTexPlugin : -OIDtype assigned -OIDmetadata Number. Cela signifie que l\'élément de métadonnées \"Number\" sera utilisé comme identifiant de l\'enregistrement, à la place de l\'identifiant de hachage défini par défaut dans Greenstone. Ces options sont utilisables avec tous les plugiciels.
La recherche par champ à travers une interface basée sur un formulaire est sélectionnée par format SearchTypes \"form,plain\" dans le fichier de configuration. En fait, cette collection utilise format SearchTypes \"form,plain\" qui contient aussi un index de recherche de texte simple textuelle (puisque form vient en premier, c\'est l\'interface par defaut; vous accédez à la recherche plain a travers la page Préférences).
L\'option buildtype montre que c\'est le moteur de recherche par défaut mgpp qui sera utilisé. La ligne indexes définit les index pour \"text\", et \"metadata\". Dans ce cas, \"text\" sera l\'enregistrement BibTex dans son format original. \"metadata\" est un mot-clé particulier qui signifie qu\'un index sera construit pour toutes les métadonnées présentes dans la collection. Ainsi, quand les menus déroulants \"Field\" dans la page recherche sont sélectionnés, ils montrent Full records suivi par une entrée pour chaque élément de méta-donnée. Une méta-donnée collectionmeta de niveau collection peut être spécifiée pour tout index pour déterminer ce qui est appele dans le menu (exceptè pour metadata qui produit beaucoup d\'éléments de menu). Dans ce cas,le fichier de configuration spécifie que l\'index du texte devrait être appele \"full records\" parcequ\'il contient l\'enregistrement bibliographique original.
Un mot clé supplémentaire, \"allfields\", peut aussi être utilisé dans la ligne indexers, pour préciser qu\'une recherche combinée sur tous les index est disponible.
Les lignes levels ne précisent qu\'un niveau document, puisque les notices bibliographiques n\'ont pas de structure interne.
Cette collection contient les \"browsers\" Title, Author,et Date ainsi qu\'un type special d\'index de phrase appele \"Phind\". Le classificateur AZCompactList utilisé pour le browser Author est comme AZList mais produit un rayon pour les éléments dupliqués comme montré ici. Le plugin BibTEX enregistre chaque auteur comme méta-donnée Author; il met aussi une liste contenant tous les auteurs dans l\'élément de méta-donnée Creator. Par conséquent, le classificateur AZCompactList est basé sur Author. Cependant, Greenstone a un bouton standard appelé authors dont le nom (qui prête à confusion) est \"Creator\", ainsi le nom de ce bouton est spécifié pour le classificateur.
Le classificateur \"Phind\" crée un index d\'expression comme ceci. Il contient une liste d\'expressions qu\'on peut parcourir extraite du materiel spécifié dans l\'argument text de la ligne Classify Phind du fichier de configuration. Ici, la spécification est :
document:Title,document:Creator,document:Booktitle,document:Publisher-- c\'est le titre, la liste des auteurs, le titre du travail recueilli (s\'il y en a) dans lequel chaque article apparaît, et l\'éditeur. Il faut noter que cette spécification suit la convention mg avec level:field. Les indexes Phind sont généralement plus basés sur le texte entier de la collection, en utilisant la spécification document:text.
La meilleure façon de voir ce que fait Phind est de jouer avec cet index. Vous tapez un mot dans la boîte recherche, cliquez Search, et une liste d\'expressions contenant ce terme apparaît en haut du tableau. Cliquez sur une de ces expressions et une liste d\'expressions contenant cette expression apparaît au bas du tableau. Vous pouvez continuer à faire ceci en allongeant l\'expression de plus en plus. Ces listes peuvent être allongees en utilisant le bouton Get more phrases. A la fin de la liste d\'expression une liste de document contenant cette expression apparaît dans un texte bleu, vous pouvez allonger cette liste en cliquant sur Get more documents.
Le format de déclaration pour la liste de résultats de recherche et le browser de titre sont tous les deux déterminés par la spécification VList. Elle donne une icône de document qui renvoie sur le document lui-même (qui est la référence complète dans cette collection); le titre en gras; la méta-donnée Creator s\'il y en a, sinon la méta-donnée Editor; et la méta-donnée Month, Year s\'il y en a. En voici un exemple.
Le format de déclaration pour le browser auteur (CL2VList) est plus complexe. Le classificateur AZCompactList donne un arbre dont les nœuds sont soit des nœuds de feuilles représentant des documents ou des nœuds internes. Un élément de de méta-donnée appelé numleafdocs donne le nombre total de documents en dessous d\'un nœud interne. La déclaration de format vérifie si numleafdocs existe. Si le nœud doit être un nœud interne, dans ce cas le nœud est catalogue par son Title. Mais attention : ce classificateur est produit sur la méta-donnée Author, donc son titre -- le titre du classificateur -- est en fait le nom de l\'auteur! Ceci signifie que les nœuds des rayons sont catalogués ici suivant le nom de l\'auteur. Les nœuds d\'extrémité sont catalogués dans la liste des résultats de recherche de la même façon que les documents (c.-à-d. les références) .
Les documents eux-mêmes (voici un exemple) sont produits par deux déclarations de format, une (longue celle-la) appelée DocumentHeading, et une autre appelée DocumentText. Le Document Heading, qui est représente les deux tiers supérieurs de la page contient le Titre du document suivi d\'une table qui donne tous les éléments de méta-donnée que le plugin BibTex peut générer. Le rôle de toutes les instructions If dans le fichier de configuration est de déterminer les éléments définis.
Le DocumentText montre la version BibTex de la référence. Cependant, quand le document est affiché la première fois, seul le lien ShowBibtexRecord apparaît --- ceci correspond à la dernière partie (c\'est la partie \"else\") de l\'instruction If dans DocumentText. Quand le lien est cliqué, href va vers la même URL mais avec showrecord=1, qui génère une page comme celle-ci. Le test If marche, ce qui affiche le Text du document. Avec le plugin BibTex, le texte d\'un document est son enregistrement BibTEX pur. " # -- Spanish text ---------------- collectionmeta collectionextra [l=es] " Esta colección contiene _about:numdocs_ registros de BibTeX y ha sido creada a partir de papers de trabajos publicados entre 1997 y 2006 por el Departmento de Ciencias de la Computación, de la Universidad de Waikato.\n
El archivo de configuración de la colección empieza con la especificación groupsize 200. Esto agrupa 200 documentos dentro de un único archivo. Por lo general las colecciones bibliográficas tienen muchos documentos pequeños y al agruparlos se evita que las estructuras de archivos internos de Greenstone crezcan demasiado y ocupen más espacio del necesario.
Además de los plugins estándar, esta colección utiliza BibTexPlugin, el cual procesa referencias en formato BibTeX (bien conocido entre los científicos). Se han fijado dos opciones para BibTexPlugin: -OIDtype assigned -OIDmetadata Number. Esto significa que el elemento de metadato \"Number\" se usará como identificador de registro, en lugar de los identificadores hash de Greenstone. Estas opciones están disponibles para todos los plugins.\n
La búsqueda por campos con una interfaz basada en formularios se habilita mediante la sentencia format SearchTypes \"form,plain\" en el archivo de configuración. De hecho, esta colección también utiliza la forma simple de búsqueda. Dado que form aparece primero es la forma predeterminada de búsqueda. La forma simple se puede seleccionar por medio de la página de Preferencias.
La opción buildtype muestra que el motor de búsqueda utilizado por defecto es el mgpp. La línea indexes especifica los índices \"text\", y \"metadata\". En este caso, \"text\" será el registro original BibTeX. \"metadata\" es una clave especial que significa que debe construirse un índice por cada metadato encontrado en la colección. Así, cuando los menúes de \"campo\" se despliegan en la página de búsqueda, muestran el registro completo seguido de una entrada para cada elemento del metadato. El metadato a nivel de colección collectionmeta se puede especificar para cualquier índice con el fin de determinar lo que se selecciona en el menú (excepto metadato, que produce varios ítems). En este caso el archivo de configuración especifica que el índice de texto debería llamarse \"registro completo\", debido a que contiene el registro bibliográfico original.
Una clave adicional, \"allfields\", también puede usarse en la línea indexes, especificando una búsqueda combinada sobre todos los índices disponibles.
La línea levels indica solamente el nivel de documento, ya que los registros bibliográficos no poseen una estructura interna.
Esta colección contiene clasificadores por Título, Autor y Fecha, así como un tipo especial de índice de frases llamado \"Phind\". El clasificador AZCompactList que se usa para el clasificador de Autor es como AZList, pero genera un estante para los ítems duplicados tal como se muestra aquí. El plugin BibTeX registra a cada autor como metadato Author. También coloca una lista de todos los autores en el elemento del metadato Creator. Como resultado de ello, el clasificador AZCompactList se basa en el Author. Sin embargo, Greenstone tiene un botón estándar que lee los autores y cuyo nombre es (de manera un tanto confusa) \"Creator\", por lo que el nombre de este botón ha sido especificado para el clasificador.
El clasificador \"Phind\" crea un índice de frases como este, el cual contiene una lista navegable de frases extraídas del material especificado en el argumento text de la línea classify Phind en el archivo de configuración. Aquí la especificación es
document:Title,document:Creator,document:Booktitle,document:Publisher\n
es decir, el título, la lista de autores, el título del trabajo (si es que hay alguno) en el que aparece este ítem y el editor. Recuerde que esta especificación sigue la convención mg con level:field. Los índices Phind se basan más comúnmente en el texto completo de una colección por medio de la especificación document:text.
La mejor forma de ver lo que hace Phind es practicar con este índice. Escriba una palabra en el cuadro de búsqueda, haga click en Buscar y una lista de frases con dicho término aparecerá en el panel de la parte superior. Haga click en una de estas frases y una lista de frases que contengan dicha frase aparecerá en el panel de la parte inferior. Usted puede continuar extendiendo la frase más y más. Las listas se pueden alargar utilizando el botón obtener más frases. Al final de la lista de frases aparece una lista de los documentos que contienen dicha frase en azul. Usted puede extender esta lista haciendo click en más documentos.
Los cadenas de formateo para la lista de resultados de la búsqueda y el clasificador por títulos se determinan por medio de la especificación VList. Ésta proporciona un icono de documento que lo vincula con el documento mismo (el cual es en esta colección la referencia completa), el título en negritas, el metadato Creator si es que hay alguno o en su defecto el metadato Editor, y el metadato de Month, Year si es que hay alguno. He aquí un ejemplo.
La cadena de formateo para el explorador por autor (CL2VList) es más compleja. El clasificador AZCompactList genera un árbol cuyos nodos son hojas representando documentos o nodos internos. Un ítem de metadato llamado numleafdocs proporciona el número total de documentos debajo de un nodo interno. Este enunciado de formato comprueba si numleafdocs existe. En caso afirmativo se trata de un nodo interno, en cuyo caso el nodo se etiquetará por su Título. ¡Pero cuidado! Este clasificador se genera en el metadato Autor, por lo que su título -- el título del clasificador -- es realmente el nombre del autor, lo que significa que los nodos del estante que están aquí se etiquetan de acuerdo al nombre del autor. Las hojas se etiquetan de la misma manera que los documentos (es decir, referencias) en la lista de resultados de la búsqueda.
Los documentos (he aquí un ejemplo) se generan por medio de dos cadenas de formato, una llamado DocumentHeading, que es bastante larga, y otra llamada DocumentText. DocumentHeading ocupa los dos tercios superiores de la página y contiene el Título del documento seguido por una tabla de todos los elementos del metadato que el plugin BibTeX puede generar. El papel de todos los enunciados If en el archivo de configuración es determinar los elementos que se definen.
DocumentText muestra la versión BibTeX de la referencia. Sin embargo, cuando el documento se despliega por primera vez únicamente aparece un hipervínculo llamado Mostrar Registro BibTex. Este corresponde a la última parte (es decir, a la parte \"adicional\") del enunciado If en DocumentText. Cuando se hace click en este hipervínculo la href va al mismo URL pero con showrecord=1, que genera una página como ésta. A continuación sigue la prueba If, que muestra el Texto del documento. Con el plugin BibTeX el texto de un documento es su registro BibTeX no adulterado. " # -- Russian text ---------------- collectionmeta collectionextra [l=ru] " Эта коллекция, которая содержит элементы записи _about:numdocs_ BibTeX, is a collection of working papers published from 1997 to 2006 at Department of Computer Science, the University of Waikato.\n.
Файл конфигурации коллекции начинается с определения groupsize 200, **которое объединяет документы в группы по 200**. Библиографические коллекции обычно состоят из большого числа небольших документов, и группировка их вместе предотвращает внутренние файловые структуры Greenstone от увеличения объёма и занятия большего дискового пространства, чем необходимо.
Apart from the standard plugins, this collection uses BibTexPlugin, which processes references in the BibTeX format (well known to computer scientists). Two options have been set for BibTexPlugin: -OIDtype assigned -OIDmetadata Number. This means the metadata element \"Number\" will be used as the record identifier, instead of Greenstone\'s default hash identifiers. These options are available for all plugins.\n
Fielded searching, with a form-based interface, is selected by format SearchTypes \"form,plain\" in the configuration file. In fact, a plain textual full-text search index is included in this collection as well (since form comes first, it is the default interface; you reach the plain search through the Preferences page).\n
The buildtype option shows that the default search engine mgpp is used. The indexes line specifies indexes for \"text\", and \"metadata\". In this case, \"text\" will be the original BibTeX record. \"metadata\" is a special keyword signifying that an index should be built for any metadata item found in the collection.
Таким образом, когда на поисковой странице появляется спускающееся меню \"поле\", в нём показан полный список, сопровождающий при входе для каждого элемента метаданных. Метаданные на уровне коллекции collectionmeta могут быть заданы для любого индекса, чтобы определить, что это означает в меню (за исключением metadata, которое создает много пунктов меню). В этом случае конфигурационный файл определяет, что текстовый индекс должен быть назван \"full record\", потому что она содержит оригинальную библиографическую запись.
An additional keyword, \"allfields\", could also be used in the indexers line, specifying that combined searching over all indexes should be available.
The levels lines specifies only document level, as bibliographic records don\'t have internal structure.
Эта коллекция содержит программы просмотра по Названию, Автору и Дате, и специальный вид индекса фразы, называемый \"Phind\". Классификатор AZCompactList, используемый для просмотра по Автору, похож на AZList, но генерирует книжную полку для дубликатов, как показано здесь. Плагин BibTeX составляет запись для каждого автора по метаданным Author; он также помещает список, содержащий перечень всех авторов, в элемент метаданных Создатель (Creator). Таким образом, классификатор AZCompactList базируется на поле Author. Однако в Greenstone имеется стандартная кнопка, читающаяся как Авторы, чье наименование отдаленно соответствует Creator, так что название этой кнопки использовано для классификатора.
Классификатор \"Phind\" создает индекс фразы подобно показанному здесь. Он содержит список доступных для просмотра фраз, извлеченных из материала, указанного в аргументе text строки classify в Phind конфигурационного файла. Определениями здесь являются
document:Title,document:Creator,document:Booktitle,document:Publisher\n
(документ:Название, документ:Создатель, документ:Заголовок книги, документ: Издатель) то есть название, список авторов, название любого сборника работ, в котором этот пункт появляется, и издатель. Обратите внимание, что эти определения соответствуют обычному mg на уровне:поле (level:field). Индексы чаще базируются на основе полнотекстовой коллекции, используя спецификацию документа:text.
�учший способ увидеть, что Phind делает, состоит в том, чтобы поиграть с этим индексом. Вы напечатали слово в поле поиска, щелкнули Поиск, и список фраз, содержащих этот термин, появляется на верхней панели. Щелкните на одной из этих фраз, и список, содержащий эту фразу, появляется на нижней панели. Вы можете продолжать делать это, расширяя фразу все более. Списки могут быть увеличены, используя кнопку get more phrases. В конце списка фраз появляется список документов, содержащих эту фразу, окрашенный в синий цвет. Вы можете расширить этот список путем щелчка на more documents.
Операторы формата для списка результатов поиска и наименование браузера оба определены в спецификации VList. Они создают изображение (иконку) документа, которое связывается с самим документом (который в данной коллекции является полной ссылкой); Название выделено полужирным шрифтом; метаданные Creator??Создателя документа, если таковой имеется, или же метаданные Editor??Издателя и метаданные Month, YearДаты, если она существует. Здесь приводится пример.
Оператор формата для показа автора (CL2Vlist) является более сложным. Классификатор AZCompactList генерирует дерево, узлы которого являются или узлами списка, представляя документы, или же внутренними узлами. Пункт метаданных, называемый numleafdocs, дает общее количество документов, расположенных ниже внутреннего узла. Этот оператор формата проверяет, существуют ли число листов документов numleafdocs. Если это так, то узел должен быть внутренним узлом. В этом случае имеет свою метку Название. Но имейте в виду, что этот классификатор произведен на основе метаданных Автора, так что его название - название классификатора -- является фактически именем автора. Это означает, что узлы книжной полки здесь названы именем автора. Узлы листа, однако, помечены таким же образом, как документы (то есть ссылки на них), находящиеся в списке результатов поиска.
Сами же Документы (здесь имеется пример), генерируются двумя операторами формата, один из которых (длинный) назван DocumentHeading, а другой - DocumentText. DocumentHeading, который составляет верхние две трети страницы, содержит Название документа, сопровождаемое таблицей, которая содержит все элементы метаданных, которые плагин BibTex может генерировать. Назначение всех операторов If в конфигурационном файле состоит в том, чтобы решить, какие элементы определены.
DocumentText показывает BibTex-версию ссылки. Однако, когда документ показан в первый раз, появляется только гиперссылка Show BibTex Record. Это соответствует последней части, то есть значению \"другой\" оператора If в DocumentText. Если щелкнуть на этой гиперссылке, href идет к тому же самому URL, но с Showrecord=1, который генерирует страницу подобно этой. Последующий тест If показывает Текст документа. Плагин BibTeX дает запись текста документа в формате BibTeX. " # -- Simplified Chinese text ---------------- collectionmeta collectionextra [l=zh] " 本馆藏包含了_about:numdocs_条BibTeX记录,是一个由怀卡托大学 计算机系在1997至2006年间发表的工作论文组成。\n
本馆藏的配置文件的开头定义了groupsize 200。 这个定义决定了每200个文档将被组合成一个存储文档。文献馆藏通常由很多很小的文档组成,而将它们组合起来可以避免Greenstone的内部 文件结构过于庞杂以及占用不必要的磁盘空间。\n
在标准的插件之外,本馆藏使用了BibTexPlugin,这个插件处理BibTeX格式(这是计算机学家熟悉的格式)的参考文献。 BibTexPlugin设置了两个参数:-OIDtype assigned -OIDmetadata Number。这意味着元数据元素\"Number\"(数字)将被用作记 录的标识符,而不是Greenstone缺省的哈希(hash)标识符。所有插件都有这些参数。\n
基于表格界面的字段搜索是通过配置文件中的format SearchTypes \"form,plain\"设定。事实上,这个馆藏还包含了一个全文本的 全文搜索索引(由于form在先,基于表格的界面是缺省的界面;你可通过偏好页面转换到plain(普通)搜索界面)。\n
buildtype选项显示本馆藏使用的是缺省的mgpp搜索引擎。indexes行指定了本馆藏的索引:\"text\"(全文) 以及\"metadata\"(元数据)。在这种情况下,\"text\"(全文)指原始的BibTeX记录。\"metadata\"(元数据)是一个特殊的指定,说明为所有本 馆藏中包含的元数据创建一个索引。因此当下拉搜索页面中的\"字段\" 菜单时,他们将显示所有记录,随后是每个元数据元素。馆藏级别的元数据collectionmeta可被用于定义索引在菜单项中的显示 名字(除了metadata(元数据),因为它将生成多个菜单项)。 在这种情况下,配置文件指定文本索引应被称作\"所有记录\"因为它包含 原始的文献记录。\n
另一个关键词,\"allfields\"(全部字段)同样可被用在indexes行中,此时说明可以组合所有索引进行搜索。
levels(级别)只指定了文档级别,因为文献记录并没有内部结构。
本馆藏包含题名,作者以及日期浏览器,以及一个特殊的词组索引称作\"Phind\"。 AZCompactList分类器被用作作者浏览器,并与AZList类似,但会为重复条目创建一个书架, 如这里所示。BibTeX插件用作者元素来记录每个作者, 所有作者的列表也被记录到著者元数据元素中。因此AZCompactList分类器是构建在作者元数据上的。然而, Greenstone中有一个名叫作者的标准按钮,这个按钮的名字也是\"作者\",可能会引起混淆,因此该分类器将使用这个按钮名。\n
\"Phind\"分类器创建一个词组索引,如这里所示。它包括一个 可浏览的词组列表,该列表包括的词组抽取自配置文件中 classify Phind行中的text参数所指定的文档。 这里的设定是\n
document:Title,document:Creator,document:Booktitle,\n document:Publisher\n ——也就是说,题名,作者列表,记录的合集题名(如果有的话),以及出版商。请注意,这里的设定遵循mg格式,即 level:field。Phind索引通常情况下都是在馆藏的所有文本基础上创建的,用document:text设定。\n
要弄清Phind的功能,最好的方式是使用这个索引。在搜索框中输入一个词,点击搜索,然后在最上面的面板中将显示包含该词的 词组列表。点击其中的一个词组,然后一组包含该词组的词组列表将显示在下面的界面中。你可以继续下去,继续扩展词组。这个列表 可以通过获得更多词组按钮进行扩展。在这个词组列表的最末尾是一个包含该词组的文档列表,并用蓝色文字显示。这个文档列表可通 过点击获得更多文档来扩展。\n
搜索结果列表的格式变量以及题名浏览器都是由VList设定的。它生成一个链接到文档本身的文档图标(在本馆藏中是完整的参考 文献)、用黑体显示题名、显示作者信息(如果有的话),否则显示编辑元数据、年月元数据(如果有的话)。 这里 是一个例子。\n
作者浏览器的格式变量(CL2VList)则更为复杂。AZCompactList分类器生成一个树型结构,其节点要么是代表文档的 叶子节点,要么是内部节点。numleafdocs元数据项给出了一个内部节点下的文档总数。这个格式变量将检查numleafdocs是否存在。 如果存在的话,则该节点必然是一个内部节点,在这种情况下,该节点将被其题名所标识。要注意的是,该分类器是基于作者 元数据创建的,因此其题名——分类器的题名——实际上是作者的名字!这意味着书架节点, 如这里所示,将被作者名字所标识。然而搜索结果列表中的所有叶子 节点则都用同一种方式标识为文档(即引文)。\n
文档本身(如示例所示)则由两个格式参 数所生成,一个(长的)称为DocumentHeading,另一个称为DocumentText。DocumentHeading负责页面的上 面三分之二部分,包括文档的题名,接下来是给出BibTeX插件可生成的所有元数据元素的表格。 配置文件中的所有If参数的作用是用来判断哪些元数据元素 是被定义了的。\n
DocumentText显示了BibTeX格式的引文。然而,当文档最初被显示时,只有一个显示BibTex记录的链接——这对应于 DocumentText中If条件的最后那部分(即\"其他\"部分。当点击该链接时,href链接到同一URL但showrecord=1, 这将生成一个类似于这里的页面。 If判断成立的话,则显示文档的文本。用BibTeX插件,文档的文本是指其原始的BibTeX记录。\n "