name=Demostración de MSWord y PDF document_text=documentos shortDescription=Esta colección demuestra la capacidad del programa Greenstone para construir colecciones con documentos en diferentes formatos. Contiene artículos escritos por varios de los miembros del proyecto NZDL en formato PDF, MSWord, RTF y Postscript. description1=

Los documentos han sido producidos por miembros del Departamento de Ciencias de la Computación, de la Universidad de Waikato. La Universidad tiene el copyright. Ellos pueden distribuirse libremente, sin ninguna restricción.

description2=

Cómo trabaja esta colección

Este archivo de configuración de la colección contiene los cuatro plugins WordPlugin, RTFPlugin, PDFPlugin y PostScriptPlugin (junto con los cuatro plugins estándar, GreenstoneXMLPlugin, MetadataXMLPlugin, ArchivesInfPlugin y DirectoryPlugin). Los cuatro plugins extraen los metadatos de Título y Fuente (es decir, nombre del archivo).

description3=

Greenstone contiene un software de otro fabricante que se utiliza para convertir archivos Word, RTF, PDF y PostScript a HTML. El equipo de Greenstone no le da mantenimiento a estos módulos, aunque incluimos las más recientes versiones con cada nueva versión de Greenstone. Los errores lógicos surgen con documentos Word inusuales (p. ej. provenientes de sistemas Macintosh anteriores) y en ocasiones el texto no se extrae adecuadamente. Algunos archivos PDF no contienen textos legibles de ninguna manera, ya que están compuestos de una secuencia de imágenes de página de las cuales el texto únicamente se puede extraer por medio del reconocimiento óptico de caracteres (OCR por sus siglas en inglés), que es algo que Greenstone no pretende hacer. Si encuentra estos problemas entonces puede remover el documento dañado de la colección, o tratar de usar alguna de las opciones avanzadas para procesar los documentos de diferentes maneras. Para más información, vea los tutoriales avanzados sobre PDF y Word en la wiki de Greenstone.

description4=

El archivo de configuración incluye un solo índice basado en el texto de los documentos y un clasificador AZList basado en el metadato de Título, tal como se muestra aquí (el selector alfabético se suprime automáticamente ya que la colección contiene únicamente unos cuantos documentos). Sin embargo, no se especifica ningún enunciado de formato. En ausencia de información explícita, Greenstone suministra los formatos por omisión. En este caso, el formato por omisión para el clasificador proporciona\:

description5=Aquí se describe un enunciado de formato que logra exactamente el mismo efecto de manera explícita. Se aplica a todas las Vlists y por lo tanto controla tanto la lista de resultados de la búsqueda como el explorador de títulos por orden alfabético.