XML - Codificação


Advertisements

Codificação é o processo de converter caráteres do unicode em sua representação binária equivalente. Quando o processador de XML lê um original de XML, codifica o original segundo o tipo de codificação. Daqui, nós precisamos de especificar o tipo de codificação na declaração de XML.

Tipos da codificação

Há principalmente dois tipos de codificação:

  • UTF-8
  • UTF-16

UTF suportes para UCS Transformation Format, e UCS próprio significa Universal Character Set. O número 8 ou 16 refere o número de bocados usados para representar um caráter. São 8 (um byte) ou 16 (dois bytes). Para os originais sem informação de codificação, UTF-8 é ajustado à revelia.

Sintaxe

O tipo da codificação é incluído na seção do prólogo do original de XML. A sintaxe para a codificação de UTF-8 é como abaixo:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

Sintaxe para a codificação UTF-16

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

Exemplo

O exemplo de seguimento mostra a declaração da codificação:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>Howcodex</company>
   <phone>(011) 123-4567</phone>
</contact-info>

No exemplo acima codificar= " UTF-8”, especifica que 8 bocados estão usados para representar os caráteres. Para representar caráteres de 16 bits, UTF-16 a codificação pode ser usada.

Os arquivos de XML codificados com UTF-8 tendem a ser menores em tamanho do que aqueles codificados com formato UTF-16.

Advertisements