Codificação é o processo de converter caráteres do unicode em sua representação binária equivalente. Quando o processador de XML lê um original de XML, codifica o original segundo o tipo de codificação. Daqui, nós precisamos de especificar o tipo de codificação na declaração de XML.
Há principalmente dois tipos de codificação:
UTF suportes para UCS Transformation Format, e UCS próprio significa Universal Character Set. O número 8 ou 16 refere o número de bocados usados para representar um caráter. São 8 (um byte) ou 16 (dois bytes). Para os originais sem informação de codificação, UTF-8 é ajustado à revelia.
O tipo da codificação é incluído na seção do prólogo do original de XML. A sintaxe para a codificação de UTF-8 é como abaixo:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
Sintaxe para a codificação UTF-16
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
O exemplo de seguimento mostra a declaração da codificação:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>Howcodex</company> <phone>(011) 123-4567</phone> </contact-info>
No exemplo acima codificar= " UTF-8”, especifica que 8 bocados estão usados para representar os caráteres. Para representar caráteres de 16 bits, UTF-16 a codificação pode ser usada.
Os arquivos de XML codificados com UTF-8 tendem a ser menores em tamanho do que aqueles codificados com formato UTF-16.