Que es xml en informatica

Que es xml en informatica

Lenguaje de marcado

El XML canónico es una forma normal de XML, pensada para permitir una comparación relativamente sencilla de pares de documentos XML para su equivalencia; para ello, la transformación XML canónica elimina las diferencias no significativas entre los documentos. Cualquier documento XML puede convertirse a XML canónico.

Por ejemplo, XML permite que haya espacios en blanco en varios puntos dentro de las etiquetas de inicio y que los atributos se especifiquen en cualquier orden. Estas diferencias rara vez o nunca se utilizan para transmitir un significado, por lo que estas formas se consideran generalmente equivalentes:

Al convertir un documento XML arbitrario a XML canónico, los atributos se codifican en un orden normativo (alfabético por nombre), y con espaciado y entrecomillado normativos (aunque con todas las declaraciones de espacio de nombres colocadas por delante de los atributos normales, y los atributos con espacio de nombres ordenados por espacio de nombres en lugar de por prefijo o nombre cualificado). Así, la segunda forma anterior se convertiría en la primera.

Según el W3C, si dos documentos XML tienen la misma forma canónica, entonces los dos documentos son lógicamente equivalentes dentro del contexto de la aplicación dada (excepto por las limitaciones relativas a algunos casos inusuales).

Sgml

El Lenguaje de Marcado Extensible (XML) es un lenguaje de marcado que define un conjunto de reglas para codificar documentos en un formato que sea tanto legible para el ser humano como para la máquina. La especificación XML 1.0 del World Wide Web Consortium[2] de 1998[3] y otras especificaciones relacionadas[4] -todas ellas estándares abiertos y gratuitos- definen XML[5].

Los objetivos de diseño de XML hacen hincapié en la simplicidad, la generalidad y la facilidad de uso en Internet[6]. Es un formato de datos textual con un fuerte soporte a través de Unicode para diferentes idiomas humanos. Aunque el diseño de XML se centra en los documentos, el lenguaje se utiliza ampliamente para la representación de estructuras de datos arbitrarias[7] como las utilizadas en los servicios web.

Se han desarrollado cientos de formatos de documentos que utilizan la sintaxis XML[8], como RSS, Atom, SOAP, SVG y XHTML. Los formatos basados en XML se han convertido en los predeterminados de muchas herramientas ofimáticas, como Microsoft Office (Office Open XML), OpenOffice.org y LibreOffice (OpenDocument), y el iWork de Apple[cita requerida]. XML también ha proporcionado el lenguaje base para protocolos de comunicación como XMPP. Las aplicaciones de Microsoft .NET Framework utilizan archivos XML para la configuración, y las listas de propiedades son una implementación del almacenamiento de la configuración construida sobre XML[9].

Xfa

Todos sabemos que Internet es una gran red que cubre todo el mundo con miles de millones de dispositivos que utilizan muchas plataformas diferentes. Pero no todos los dispositivos comparten la misma aplicación o plataforma de comunicación.

A mediados de los años 90, los expertos de SGML (Standard Generalized Markup Language), un sistema para organizar y etiquetar los elementos de los documentos XML, empezaron a notar el problema de la comunicación en la plataforma de la World Wide Web.

Jon Bosak, líder del equipo de investigación, planteó a la principal organización internacional de normalización de la World Wide Web (W3C) un programa llamado «SGML en la Web». Y esta es la premisa del lenguaje de marcado extensible XML que utilizamos más adelante.

El archivo XML existe como texto plano y puede ser abierto y manipulado por muchos tipos de software diferentes. Aunque posee un formato de texto, XML no es legible, y estos archivos sólo sirven para que diferentes sistemas se comuniquen entre sí.

La cabecera de un archivo XML suele tener la forma <?xml version=»A» encoding=»B»?>. Por lo tanto, A es el elemento utilizado para declarar el documento XML de lenguaje de marcas que se está utilizando. El valor restante «B» representa la información sobre las referencias de caracteres numéricos.

Ejemplo de xml

Los espacios de nombres XML se utilizan para proporcionar elementos y atributos con nombres únicos en un documento XML. Se definen en una recomendación del W3C[1][2] Una instancia XML puede contener nombres de elementos o atributos de más de un vocabulario XML. Si a cada vocabulario se le asigna un espacio de nombres, se puede resolver la ambigüedad entre elementos o atributos con nombres idénticos.

Un ejemplo sencillo sería considerar una instancia XML que contenga referencias a un cliente y a un producto pedido. Tanto el elemento cliente como el elemento producto podrían tener un elemento hijo llamado id. Por lo tanto, las referencias al elemento id serían ambiguas; si se colocaran en espacios de nombres diferentes, se eliminaría la ambigüedad.

Un nombre de espacio de nombres es un identificador uniforme de recursos (URI). Normalmente, el URI elegido para el espacio de nombres de un determinado vocabulario XML describe un recurso bajo el control del autor o de la organización que define el vocabulario, como por ejemplo una URL del servidor web del autor. Sin embargo, la especificación del espacio de nombres no requiere ni sugiere que el URI del espacio de nombres se utilice para recuperar información; simplemente es tratado por un analizador XML como una cadena. Por ejemplo, el documento en http://www.w3.org/1999/xhtml no contiene ningún código. Simplemente describe el espacio de nombres XHTML a los lectores humanos. El uso de una URI (como «http://www.w3.org/1999/xhtml») para identificar un espacio de nombres, en lugar de una simple cadena (como «xhtml»), reduce la probabilidad de que diferentes espacios de nombres utilicen identificadores duplicados.