编码 是Unicode字符转换为等效的二进制表示的过程。当XML处理器读取XML文档,它编码依赖于编码的类型的文件。因此,我们需要指定XML声明的编码类型.
主要有两种类型的编码:
UTF代表UCS转换格式,但UCS的意义是通用字符集。编号8或16中的指用来表示一个字符的比特数。它们或者是8(一个字节)或16(两个字节)。对于没有编码信息的文件,UTF-8的默认设置.
编码类型被包括在XML文档的序言部分。句法为UTF-8编码方式如下图所示:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
UTF-16 编码的句法
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
下面的例子显示的声明编码:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>Howcodex</company> <phone>(011) 123-4567</phone> </contact-info>
在上面的例子中的编码=“UTF-8”,则指定的8位被用于表示字符。来表示的16位字符,UTF-16编码可使用.
UTF-8编码的XML文件比UTF-16格式的文件更小.