Codierung ist der Prozess der Umwandlung von Unicode-Zeichen in ihre äquivalente binäre Darstellung. Wenn der XML-Prozessor wird ein XML-Dokument, es codiert das Dokument in Abhängigkeit von der Art der Codierung. Daher müssen wir die Art der Codierung in der XML-Deklaration angeben.
Es gibt im hauptsächlich zwei Arten von Codierung:
UTF steht für UCS Transformation Format, und UCS selbst bedeutet Universal Character Set. Die Zahl 8 oder 16 bezieht sich auf die Anzahl von Bits, die zur Darstellung eines Zeichens. Sie sind entweder 8 (ein Byte) oder 16 (zwei Bytes). Für die Dokumente, ohne codierung Informationen, UTF-8 ist set durch Standard gesetzt.
Encoding Typ wird im Prolog Abschnitt des XML-Dokuments enthalten. Die Syntax für UTF-8-Codierung ist wie unten:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
Syntax für UTF-16-Codierung
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
Folgende Beispiel zeigt, Erklärung von der Codierung:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>Howcodex</company> <phone>(011) 123-4567</phone> </contact-info>
Im obigen Beispiel encoding="UTF-8", gibt an, dass 8-Bit werden verwendet, um die Zeichen darstellen. zu 16-Bit-Zeichen darstellen, UTF-16 Codierung kann verwendet werden.
kodieren