XML - Sintaxis


Advertisements

Este capítulo le lleva a través de la simple reglas de sintaxis para escribir un documento XML. Siguiente es un documento XML completo:

<?xml version="1.0"?>
<contact-info>

   <name>Tanmay Patil</name>
   <company>Howcodex</company>
   <phone>(011) 123-4567</phone>
   
</contact-info>

Se puede observar que hay dos tipos de información en el ejemplo anterior:

  • Marcado, como en el caso de <contact-info> y
  • El texto o los datos de caracteres, tutoriales y (040) 123-4567.

El siguiente diagrama muestra las normas de sintaxis para escribir diferentes tipos de marcado y el texto de un documento XML.

Reglas de sintaxis XML

Veamos cada uno de los componentes del diagrama anterior en detalle:

Declaración XML

El documento XML puede tener una declaración XML. Está escrito, como se indica a continuación:

<?xml version="1.0" encoding="UTF-8"?>

Donde versión es la versión de XML y la codificación especifica la codificación de caracteres usada en el documento.

Reglas de sintaxis de declaración XML

  • La declaración XML es sensible a mayúsculas y minúsculas y debe empezar por "<?xml>" donde "xml" se escriben en minúsculas.

  • Si el documento contiene declaración XML, estrictamente tiene que ser la primera declaración del documento XML.

  • La declaración XML debe ser estrictamente la primera declaración en el documento XML.

  • Un protocolo HTTP puede alterar el valor de la codificación que se colocan en la declaración XML.

Las etiquetas y elementos

Un archivo XML está estructurado por varios elementos XML, también llamado XML-nodos o las etiquetas XML. XML los nombres de los elementos están encerrados por corchetes triangulares < > tal y como se indica a continuación:
<element>

Las reglas de la sintaxis de las etiquetas y elementos

Sintaxis de Elemento: XML Cada elemento tiene que estar cerrada o con inicio o final con elementos como se muestra a continuación:

<element>....</element>

O en simple de los casos, sólo en esta forma:

<element/>

Anidamiento de elementos: un elemento XML puede contener varios XML de elementos como el de los niños, pero los niños no deben superponerse elementos, es decir, una etiqueta de cierre del elemento debe tener el mismo nombre que el de la más reciente etiqueta de inicio sin precedentes.

Ejemplo siguiente muestra las etiquetas anidadas incorrecta:

<?xml version="1.0"?>
<contact-info>
<company>Howcodex
<contact-info>
</company>

Ejemplo siguiente muestra la correcta las etiquetas anidadas:

<?xml version="1.0"?>

<contact-info>
   <company>Howcodex</company>
<contact-info>

Elemento raíz: Un documento XML sólo puede tener un elemento raíz. Por ejemplo, no es un documento XML correcto, ya que tanto los elementos x e y se producen en el nivel superior sin un elemento raíz:

<x>...</x>
<y>...</y>

El ejemplo siguiente muestra un documento XML con formato correcto:

<root>
   <x>...</x>
   <y>...</y>
</root>

Mayúsculas y minúsculas: Los nombres de los elementos XML son sensibles a las mayúsculas y minúsculas. Esto significa que el nombre del punto de inicio y el final los elementos deben ser exactamente en el mismo caso.

Por ejemplo<contact-info> es diferente de<Contact-Info>.

Atributos

Un atributo especifica una propiedad para el elemento, utilizando un par nombre/valor. Un elemento XML puede tener uno o más atributos. Por ejemplo:

<a href="http://www.howcodex.com/">Howcodex!</a>

Aquí href es el nombre del atributo y http://www.howcodex.com/ es valor de atributo.

Reglas de sintaxis de atributos XML

  • Nombres de atributos en XML (a diferencia del HTML) son sensibles a mayúsculas. Es decir, HREF y href son dos diferentes atributos XML.
  • Mismo atributo no puede tener dos valores en una sintaxis. El ejemplo siguiente muestra sintaxis incorrecta porque el atributo b se especifica dos veces:
<a b="x" c="y" b="z">....</a>
  • Los nombres de los atributos se definen sin comillas, mientras que los valores de los atributos siempre debe aparecer entre comillas. Ejemplo siguiente muestra incorrecta sintaxis xml:
  • <a b=x>....</a>
    

    En la sintaxis anterior, el valor del atributo no está definido entre comillas.

    XML Referencias

    Por lo general las referencias que permiten agregar o incluir texto adicional o de marcado en un documento XML. Las referencias siempre comienzan con el símbolo "&" ,que es un carácter reservado y al final con el símbolo ";". XML tiene dos tipos de referencias:

    Referencias de entidad: Una referencia de entidad contiene un nombre entre el principio y el final delimitadores. Por ejemplo, &amp; donde amp es nombre. El nombre se refiere a la cadena de texto predefinidos y/o el marcado.

    Referencias de caracteres: Estos contienen referencias, como &#65;, contiene un hash (“#”) seguido de un número. El número se refiere siempre al código Unicode de un carácter. En este caso, el 65 se refiere al alfabeto "A".

    Texto XML

    • Los nombres de elementos XML y XML-atributos son sensibles a las mayúsculas y minúsculas, lo que significa que el nombre de inicio y fin elementos deben estar escritas en el mismo caso.
    • Para evitar problemas de codificación, todos archivos XML debe ser guardado como Unicode UTF-8 o UTF-16 archivos.
    • Caracteres de espacio en blanco como los espacios en blanco, los tabuladores y line-breaks entre XML y entre los elementos XML-atributos serán ignorados.
    • Algunos caracteres están reservados para la sintaxis XML. Por lo tanto, no se pueden utilizar directamente. Para utilizarlos, cierto grado de sustitución de las entidades se emplean, que se enumeran a continuación:
    Caracteres no permitidos Sustitución de la entidad Descripción del personaje
    < &lt; Menos de
    > &gt; Mayor que
    & &amp; AMPERSAND
    ' &apos; Apóstrofe
    " &quot; Signo de interrogación
    Advertisements