Зашифрование характера метод преобразовывать байты в характеры. Для того чтобы утвердить или показать документ HTML правильно, программа должна выбрать правильное зашифрование характера.
Самый общий характер - зашифрование комплекта или характера в пользе на компьютерах ASCII Код американского стандарта для взаимообмена информации, и это вероятно наиболее широко используемый характер - установите для шифруя текста электронно.
Зашифрование ASCII поддерживает алфавит только верхних и строчной буквы латинский, 0-9, и некоторые экстренные характеры которые делают итог 128 характеров в всех. Вы можете иметь взгляд на полном наборе Printable характеров ASCII
Однако, много языков используют или accented латинские характеры или алфавиты совершенно другой. ASCII не адресует эти характеры; поэтому вам нужно выучить о зашифрованиях характера если вы хотите использовать любые характеры non-ASCII.
Организация международных стандартов создала ряд характера - комплектов, котор нужно общаться с различными национальными характерами. Для документов в английских и большинств других западно-европейский языках, использовано широко поддержанное шифруя ISO-8859-1.
Здесь список характера - комплекта будучи использованным вокруг мира вместе с их описанием.
Характер - комплект | Описание |
---|---|
ISO-8859-1 | Часть 1 латинского алфавита Заволакивание Северная Америка, Западная Европа, Латинская Америка, theCaribbean, Канада, Африка |
ISO-8859-2 | Часть 2 латинского алфавита Заволакивание Восточная Европа |
ISO-8859-3 | Часть 3 латинского алфавита SE Европа заволакивания, эсперанто, разносторонние другие |
ISO-8859-4 | Часть 4 латинского алфавита Заволакивание Скандинавия/Baltics (и другие не в ISO-8859-1) |
ISO-8859-5 | Часть 5 латинского/Cyrillic алфавита |
ISO-8859-6 | Часть 6 латинского/арабського алфавита |
ISO-8859-7 | Часть 7 латинского/греческого алфавита |
ISO-8859-8 | Часть 8 латинского/древнееврейского алфавита |
ISO-8859-9 | Часть 9 алфавита латыни 5 Такие же как ISO-8859-1 за исключением турецких характеров заменяют Icelandic одни |
ISO-8859-10 | Латынь 6 Lappish латыни 6, нордический, и эскимос |
ISO-8859-15 | Эти же как ISO-8859-1 но при больше добавленных характеров |
ISO-2022-JP | Латинская/японская часть 1 алфавита |
ISO-2022-JP-2 | Латинская/японская часть 2 алфавита |
ISO-2022-KR | Латинская/корейская часть 1 алфавита |
Настроил для того чтобы изобрести консорциум Unicode после этого путь показать все характеры различных языков, вернее чем имейте эти различные несовместимые Коды характера для различных языков.
Поэтому, если вы хотите создать документы, то которые используют характеры от множественного характера - комплекты, вы будете сделать так используя одиночные зашифрования характера Unicode.
Unicode поэтому определяет зашифрования которые могут общаться с строкой в специальных путях для того чтобы сделать достаточный космос для огромного характера - комплекта он включает. Эти как UTF-8, UTF-16, и UTF-32.
Характер - комплект | Описание |
---|---|
UTF-8 | Формат перевода Unicode который приходит в 8-разрядные блоки то есть, оно приходит в байты. Характер в UTF8 может быть от 1 до 4 байта длиннь, делающ ширину переменной величины UTF8. |
UTF-16 | Формат перевода Unicode который приходит в шестнадцатиразрядные блоки то есть, оно приходит в краткости. Может быть 1 или 2 краткости длинней, делающ ширину переменной величины UTF16. |
UTF-32 | Формат перевода Unicode который приходит в трицатидвухразрядные блоки то есть, оно приходит внутри longs. Формат фикчированн-ширины и всегда 1" длиной» в длине. |
Первые 256 характеров характера Unicode - комплекты соответствуют к 256 характерам ISO-8859-1.
значением по умолчанию, обработчики HTML 4 должны поддержать UTF-8, и предположены, что поддерживают обработчики XML UTF-8 и UTF-16; поэтому все XHTML-уступчивые обработчики должны также поддержать UTF-16.