<cite>¿Hablémonos en XML?</cite>

11-13-2005

No, gracias… comuniquémonos mediante XML, pero por favor no nos hablemos en XML.

Christian Hess propone que nos hablemos en XML. Como Christian señala XML es un conjunto de estándares derivados de SGML (norma ISO 8879) y que fue diseñado para solventar cierto tiempo de problemas en la publicación electrónica de documentos, pero que se emplea cada vez con más frecuencia para intercambiar información.

En la jerga se dice que “XML es una aplicación de SGML”, lo cual se refiere al hecho que XML fue diseñado con una área de aplicación concreta en mente: las necesidades de y en la web. La “X” en XML quiere decir “extensible”, es decir, es posible extender el lenguaje para que adapte a las necesidades de una aplicación concreta, que es a lo que se refiere Christian cuando dice que se puede utilizar en el registro civil para fijar una vía para la identificación de personas físicas y sus atributos (estado civil, número de cédula, etc.).

Christian también dice:

Lo ideal, a mi parecer, sería

partir de una especificación internacional abierta conocida como XML

(acrónimo, en inglés, de “Lenguaje de marcación extensible”), que está

diseñada precisamente para esta clase de tareas. Dentro de la

terminología XML, se construiría una “definición de tipo de documento”

(DTD) que permita sentar reglas universales uniformes para tratar cada

una de las clases de datos que queramos intercambiar: información sobre

personas, bienes, normas, transacciones, citas de jurisprudencia,

etc.

XML aisladamente es un lenguaje, como decir Español o Alemán: se puede decir cualquier cosa en cualquier forma pero siguiendo un conjunto reducido de reglas. Para que la información tenga sentido es necesario definir conceptos, por ejemplo, la frase la evolución expontánea de un sistema aislado se traduce siempre en un aumento de su entropía no tiene sentido hasta que no se definan términos como “evolución”, “sistema”, “aislado” y “entropía”. Los primeros tres tienen sentido incluso fuera del área de aplicación en la cual la frase citada se ubica, pero dentro de la misma tienen un significado preciso y particular. El DTD del cual habla Christian es algo similar.

Para que XML adquiera sentido como formato de intercambio de datos hay que ir más allá y es necesario definir un protocolo. No es suficiente definir conceptos sino que es necesario establer qué información es requerida y qué información es opcional, así como el orden jerárquico en el cual la información debe estar presente. Por ello Christian llama a la asignación de un ente que coordine este proceso.

Un requisito fundamental para que esta propuesta funcione es que el gobierno regule las interacciones gobierno-gobierno y gobierno-cuidadano. La palabra “regulación” asociada con “gobierno” asusta a más de uno, pero en este contexto debe entenderse como lo que es: que se escriban las reglas mediante la cual esa interacción debe ocurrir, que esas reglas estén ampliamente disponibles y se se sigan estrictamente por parte de todos los actores. Esto puede ocurrir como directrices emanadas desde cada institución o desde “arriba” del Poder Ejecutivo. La primera forma tiene la ventaja que se puede implementar rápidamente, más tiene la desventaja de que produciría un conjunto inconsistente de “estándares”. La segunda forma es con seguridad más lenta, pero a la larga es una mejor inversión.

Ortogonalmente a esta propuesta el gobierno debe definir para sí mismo un método para publicar información dirigida a los cuidadanos, particularmente información no editable. Cuando uno visita la página web de tres entidades públicas diferentes se va a encontrar con tres formas diferentes en las cuales la información se publica: en uno son simplemente “páginas web”; en el segundo son documentos en formatos propietarios y cerrados (e.g. Microsoft Word, Microsoft PowerPoint); en el tercero son documentos en formatos explícitamente diseñados para la publicación de información no editable (e.g. PDF). Esta caracterización corresponde, por ejemplo, más o menos al Poder Judicial, la Asamblea Legislativa y la Imprenta Nacional, respectivamente.

El problema con las “páginas web”, entendiéndose estas como aquellas para las cuales se requiere solamente un navegador web y no extensiones (Macromedia Flash, Java, …) o terceros programas, es que, a menos que se de un diseño cuidadoso donde impere información sobre forma, al imprimirse no producen resultados completamente satisfactorios, es difícil guardarlas localmente para uso “off-line”, no siempre representan fielmente cierto tipo de convenciones de formato (e.g. actas, notificaciones, …). Tienen la ventaja que dada su omniprescencia se han desarrollado tecnologías de asistencia que las tornan accesibles para e.g. personas con problemas de visión.

El problema con los formatos propietarios es que requieren, por definición, de programas específicos para ser accesados. En el caso concreto de Microsoft Word existen multitud de programas que pueden “convertir” este formato a otros, pero las conversiones usualmente no son fieles al original. Adicionalmente, aunque se cuente con el programa particular que define ese formato, no es inusual que se requiera la prescencia de elementos adicionales, e.g. fuentes, para lograr una reproducción fiel. Habiendo solventado eso todavía queda el problema que si el gobierno publica información en estos formatos estaría requiriendo de los cuidadanos el licenciamiento de programas particulares.

El problema con formatos tales como PDF es que requieren de programas adicionales disponibles para quien publica la información y para quien la utiliza. En el caso concreto de PDF existen multitud de programas ya sea libres o gratuitos que permiten utilizar la información en este formato, por tanto a pesar de que igualmente se impone un licenciamiento adicional, este no se limita a opciones de un único proveedor ni tampoco representa erogaciones adicionales para el usuario. Es decir, la inversión adicional, de ser necesaria, la tiene que realizar únicamente el gobierno.

También en este caso es posible encontrar una solución en XML: existen mecanismos que permiten, a partir de un único documento XML, producir múltiples representaciones del mismo, por ejemplo páginas web y PDFs. Esto facilitaría el mantener la información sincronizada y al día.

En el caso de la información editable existen opciones tales como el formato “OpenDocument” (ODF), que es el producto de tres años de desarrollo abierto, públicamente visible, neutral con respecto a proveedores, sin tasas de licenciamiento y con retroalimentación de todas las comunidades interesadas. ODF permite simultáneamente la representación de documentos de texto, hojas electrónicas, diagramas y gráficos. Además es altamente interoperable pues hace uso de otros estándares igualmente abiertos donde es posible. Por último ODF no es un formato directamente asociado con una aplicación particular y existen de hecho múltiples programas que hacen uso del mismo.

Así pues y dada la naturaleza de XML es posible montar la propuesta de Christian sobre ODF. Un entidad tal como la que propone Christian debería definir las extensiones que se requieren sobre ODF para responder a las necesidades del país, colaborando internacionalmente con organizaciones equiparables de manera que el resultado del esfuerzo sea no solo interoperabilidad dentro del gobierno de Costa Rica sino también con otros gobiernos del mundo.



  « Anterior: Siguiente: »