El contenido estructurado es información o datos que están organizados de forma predecible. Existen varios formatos para contenido estructurado, los más destacados son XML (Lenguaje de Marcado Extensible), JSON (Notación de Objetos en JavaScript) y YAML (YAML No Es Un Lenguaje De Marcado).
XML se utiliza ampliamente en la publicación de libros y revistas académicas. Hace que el contenido académico sea independiente del diseño, más flexible y reutilizable para una variedad de formatos (por ejemplo, PDF, HTML, EPUB). También ofrece una capacidad mejorada de búsqueda, accesibilidad y preservación, y permite la extracción de texto. Los académicos de humanidades han utilizado tradicionalmente XML TEI (Iniciativa de Codificación de Texto), mientras que las editoriales utilizan cada vez más el estándar NISO JATS (Conjunto de Etiquetas para Artículos de Revistas) y su extensión BITS (Conjunto de Etiquetas para Intercambio de Libros). El estándar XML se puede introducir en diferentes etapas del proceso de producción, con flujos de trabajo XML-first, XML-last y XML-middle.
Las editoriales comerciales suelen subcontratar la producción de XML o utilizar software especializado, lo que no siempre es una opción para revistas de acceso abierto de pequeña escala con fondos limitados. En particular, Kotahi es una solución de código abierto que incluye funciones de exportación JATS XML. Sin embargo, observamos que se requieren habilidades técnicas para su instalación.
El estándar XML en la producción de revistas
El formato XML utiliza etiquetas legibles por máquina. La característica más importante de las etiquetas XML es que el etiquetado es semántico: por ejemplo, el título de un artículo se identificará con una etiqueta que lo defina como el “título del artículo”, no sólo como texto como se hace normalmente en HTML. El XML también puede cubrir otros metadatos, incluidos autores, información de financiación, fecha de publicación y más.
La ventaja de un enfoque basado en XML es que, desde el momento del envío, los manuscritos se pueden etiquetar y editar en un formato estructurado, lo que reduce las frustraciones que pueden surgir al usar diferentes versiones de documentos como PDF o Word. Los documentos XML estructurados también son más fáciles de analizar mediante inteligencia artificial y herramientas de verificación automatizadas, con posibles ahorros de tiempo en todo el flujo de trabajo de publicación.
Más adelante, cuando se publique un artículo, el uso de XML puede generar beneficios en términos de accesibilidad y visibilidad. Los motores de búsqueda pueden indexar fácilmente los documentos estructurados y los investigadores pueden considerar su análisis automatizado. Los documentos estructurados también se adaptan bien a los lectores de pantalla,201 lo que facilitaría su adecuación para su lectura a personas ciegas, usuarios con discapacidad visual o personas con trastornos de la lectura.
Desventajas de XML
Usar XML es más complejo que la publicación «básica» en PDF o HTML, y una de sus principales desventajas es la curva de aprendizaje necesaria para implementarlo de manera efectiva. Este desafío afecta particularmente a las editoriales más pequeñas que no tienen recursos técnicos internos ni presupuesto para subcontratar la producción XML. La otra desventaja de XML es que su aplicación lleva mucho tiempo, lo que podría desalentar aún más la creación de revistas.
Como resultado, muchas editoriales con recursos limitados prefieren trabajar con formatos PDF o HTML. Si una revista opta por seguir este enfoque, es esencial que los artículos sean lo más accesibles posible de acuerdo con el tiempo y los recursos disponibles.
- XML. (n.d.). Focus Area News.
- JSON. (n.d.). Introducing JSON.
- YAML. (n.d.). YAML.
- The University of Edinburgh. (2019). Support for XML-based publishing in OJS.
- NISO. (2019). ANSI/NISO Z39.96-2019, JATS: Journal Article Tag Suite, version 1.2.
- JATS, (n.d.). Book Interchange Tag Set: JATS Extension. National Center for Biotechnology Information (NCBI), U.S. National Library of Medicine.
- Kotahi. (n.d.). Features.
- Aries systems. (2020, November 12). The Benefits of an XML-First Publishing Workflow.
- Access Computing. (n.d.). Is XML accessible? University of Washington.
- Github. (n.d.). Scholarly HTML.