XML - Entidades de caractere


Advertisements

Este capítulo descreve o XML Character Entities. Antes de entendermos as entidades de caractere, vamos primeiro entender o que uma entidade XML é.

Como colocar por W3 Consórcio a definição de entidade é como segue:

A entidade documento serve como a raiz da árvore de entidade e um ponto de partida para um processador XML.

Este os meios, entidades são os placeholders em XML. Estes podem ser declarados no prólogo do original ou em um DTD. Há uns tipos diferentes de entidades e este capítulo discutirá a entidade do caráter.

Ambos, o HTML e o XML, têm alguns símbolos reservados para seu uso, que não pode ser usado como o índice no código de XML. Por exemplo, < e > os sinais são usados abrindo e fechando etiquetas de XML. Para indicar estes caráteres especiais, as entidades do caráter são usadas.

Há poucos caráteres especiais ou símbolos que não estão disponíveis para ser datilografado diretamente do teclado. As entidades do caráter podem ser usadas para indicar igualmente aqueles símbolos/caráteres especiais.

Tipos de entidades do caráter

Há três tipos de entidades do caráter:

  • Entidades predefinidas do caráter
  • Entidades numeradas do caráter
  • Entidades do caráter nomeado

Entidades predefinidas do caráter

São introduzidos para evitar a ambiguidade ao usar alguns símbolos. Por exemplo, uma ambiguidade for observada quando menos do que (< ) ou maior do que (> ) o símbolo é usado com a etiqueta do ângulo (< >). As entidades do caráter são usadas basicamente para limitar etiquetas em XML. Seguir é uma lista de entidades predefinidas do caráter da especificação de XML. Estes podem ser usados para expressar caráteres sem ambiguidade.

  • Ampersand: &amp;

  • Single quote: &apos;

  • Maior do que: &gt;

  • Menos do que: &lt;

  • Citações dobro: &quot;

Entidades do caráter numérico

A referência numérica é usada para referir uma entidade do caráter. A referência numérica pode estar no formato decimal ou hexadecimal. Porque há uns milhares de referências numéricas disponíveis, estes são um bocado duramente a recordar. A referência numérica refere o caráter por seu número no jogo de caracteres de Unicode.

A sintaxe geral para a referência numérica decimal é:

 número decimal ;

A sintaxe geral para a referência numérica hexadecimal é:

 Número hexadecimal ;

A seguinte tabela alista algumas entidades predefinidas do caráter com seus valores numéricos:

Nome de entidade Caráter Referência decimal Referência hexadecimal
quot " &#34; &#x22;
amp & &#38; &#x26;
apos ' &#39; &#x27;
lt < &#60; &#x3C;
gt > &#62; &#x3E;

Entidade do caráter nomeado

Como seu duro recordar os caráteres numéricos, o tipo o mais preferido de entidade do caráter é a entidade do caráter nomeado. Aqui, cada entidade é identificada com um nome.

Por exemplo:

  • 'Aacute' representa o capital caráter com acento agudo.

  • 'ugrave' representa o pequeno com acento grave.

Advertisements