The Greenstone Librarian Interface

4.7: «Eclater» les fichiers de métadonnées

Les métadonnées issues de bases de données telles que MARC, OAI, CDS/ISIS, BibTex, Refer et ProCite peuvent être importés dans Greenstone, mais elles ne peuvent pas être consultées ou modifiées IMMEDIATEMENT dans l'Interface Bibliothécaire. Cependant, vous pouvez «éclater» le fichier de la base dans l'Interface Bibliothécaire pour que ces opérations deviennent possibles. Alternativement, vous pouvez, particulièrement si vous maintenez une application externe maître, retourner au programme qui a créé le fichier, effectuer vos corrections, et importer de nouveau la base.

«Eclater» un fichier de base de données le divise en enregissements individuels, chacun avec métadonnées visibles et modifiables. Ce processus est irréversible: l'original du fichier de métadonnées est supprimé.

Les fichiers «éclatables» ont une icône verte dans l'Arboresence de la collection . Pour en éclater un, clic droit puis sélectionner "Éclater la base de données de métadonnées". Une fenêtre secondaire affiche des options du processus d'éclatement. L'option «plugiciel» précise le plugiciel à utiliser pour éclater la base. Dans la plupart des cas, un seul plugiciel traite un type de fichier donné, mais dans certains cas, quand différents types de fichiers partagent la même extension de nom de fichier, il peut y avoir deux plugiciels qui traitent les fichiers avec cette extension. L'option «input_encoding» peut être utilisée pour spécifier l'encodage de la base de données. L'option «metadata_set» spécifie quel jeu de métadonnées doit être enrichi des nouveaux champs générés par l'éclatement. Si rien n'est spécifié, il vous est demandé que faire avec chaque nouveau champ de la base de données : l'ajouter comme un nouvel élément d'un jeu de métadonnées existant, le fusionner avec un autre élément, ou l'ignorer.

Lorsqu'un fichier est éclaté, un nouveau document vide est créé pour chaque enregistrement, et les métadonnées de l'enregistrement sont attribuées au document. Les documents sont nommées en utilisant des numéros tels que 000001.nul, 000002.nul etc... Si l'option «document_field» est définie (avec un nom de champ de base de données), la valeur de ce champ, s'il est présent, est utilisée pour le nom du fichier. Le processus de l'éclatement tente également de télécharger le fichier et de l'utiliser à la place d'un fichier vide. Les options «document_prefix» et «document_suffix» peuvent être utilisées pour fabriquer une URL ou le chemin du fichier à partir de la valeur du document_field. L'option «records_per_folder» peut être utilisée pour regrouper en sous-dossiers les enregistrements éclatés. Si la base de données est très fournie, l'utilisation de cette option permettra d'accélérer la modification ultérieure de métadonnées.

La possibilité d'éclater un fichier est déterminée par son extension. Dans certains cas, un fichier peut être identifié comme «éclatable» alors que ce n'est pas le cas, s'il a la même extension qu'un fichier réellement «éclatable». Par exemple, le plugiciel ProCite traite les fichiers avec une extension .txt, mais la plupart des fichiers .txt sont des fichiers texte ordinaires, et non des fichiers ProCite.