XML - Encoding


Advertisements

Codierung ist der Prozess der Umwandlung von Unicode-Zeichen in ihre äquivalente binäre Darstellung. Wenn der XML-Prozessor wird ein XML-Dokument, es codiert das Dokument in Abhängigkeit von der Art der Codierung. Daher müssen wir die Art der Codierung in der XML-Deklaration angeben.

Encoding Typen

Es gibt im hauptsächlich zwei Arten von Codierung:

  • UTF-8
  • UTF-16

UTF steht für UCS Transformation Format, und UCS selbst bedeutet Universal Character Set. Die Zahl 8 oder 16 bezieht sich auf die Anzahl von Bits, die zur Darstellung eines Zeichens. Sie sind entweder 8 (ein Byte) oder 16 (zwei Bytes). Für die Dokumente, ohne codierung Informationen, UTF-8 ist set durch Standard gesetzt.

Syntax

Encoding Typ wird im Prolog Abschnitt des XML-Dokuments enthalten. Die Syntax für UTF-8-Codierung ist wie unten:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

Syntax für UTF-16-Codierung

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

Beispiel

Folgende Beispiel zeigt, Erklärung von der Codierung:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>Howcodex</company>
   <phone>(011) 123-4567</phone>
</contact-info>

Im obigen Beispiel encoding="UTF-8", gibt an, dass 8-Bit werden verwendet, um die Zeichen darstellen. zu 16-Bit-Zeichen darstellen, UTF-16 Codierung kann verwendet werden.

kodieren

Advertisements