Двоичное кодирование. Стандарты символьного кодирования.
2 ВВЕДЕНИЕ Любая информация внутри компьютера хранится и обрабатывается в виде длинного кода, состоящего всего из двух символов. Этот код называется двоичным или бинарным. По своей сути он очень похож на всем известный код Морзе, в котором двумя символами (длинный и короткий импульс) шифруются буквы для передачи текстовой информации по проводам или другим способом.
3 Компьютеры пошли значительно дальше. В них в форме бинарного кода хранятся не только текстовые данные, но и программы, музыка, изображения и даже видео высокой четкости. Перед выводом информации на экран, в аудиосистему или распечатыванием, компьютер "переводит" ее в понятный человеку язык. Но внутри компьютера она хранится и обрабатывается исключительно в виде двоичного кода.
4 Стандарты кодирования Одним из наиболее "старых" (разработан еще в 1960-х гг.) является стандарт ASCII. Это 7- битный стандарт кодирования. Как известно, ячейка из 7 битов может принимать 128 различных состояний. Соответственно, в стандарте ASCII каждому из этих 128 состояний соответствует какая-то буква, знак препинания или специальный символ. Разработчики программного обеспечения начали создавать 8-битные стандарты кодировки текста. За счет дополнительного бита диапазон кодирования в них был расширен до 256 символов. Чтобы не было путаницы, первые 128 символов в таких кодировках, как правило, соответствуют стандарту ASCII. Восьмибитными кодировками, распространенными в нашей стране, являются KOI8, UTF8, Windows-1251 и некоторые другие. Разработаны также и универсальные стандарты кодирования текста (Unicode), включающие буквы большинства существующих языков. В них для записи одного символа может использоваться до 16 битов и даже больше.
5 КОИ-7 семибитная кодировка для русского языка и обмена информацией. КОИ-7 включает в себя 3 «набора» Н0, Н1, Н2. Н0 это просто US-ASCII; в Н1 все латинские буквы заменены на русские, а символ доллара заменён на символ валюты. в Н2 заглавные латинские буквы оставлены, а строчные заменены на заглавные русские, символ доллара также заменён. Наличие только заглавных букв в Н2 не создавало особых проблем, поскольку существовала традиция использовать в текстах программ только заглавные буквы; большинство печатающих устройств также могло печатать только заглавные буквы. На практике использовался либо набор Н2 сам по себе, либо Н0/Н1 с переключением: для перехода в русский. Иногда смена набора, используемого устройством, осуществлялась ручным переключателем. Буквы Ё не было; отсутствовала также заглавная буква Ъ. Поскольку русские буквы были размещены на позициях аналогичных латинских букв, текст оставался более-менее понятным даже при неправильно выбранном режиме
6 ASCII Таблица, в которой некоторым распространённым печатным и непечатным символам сопоставлены числовые коды. Таблица была разработана и стандартизована в США, в 1963 году Таблица ASCII определяет коды для символов: десятичных цифр; латинского алфавита; национального алфавита; знаков препинания; управляющих символов. С помощью символа Backspace (BS) на принтере можно печатать один символ поверх другого: a BS ' á Сообщения, передаваемые по каналу связи, делились на две части: заголовок и текст
7 Cтандарт кодирования символов, позволяющий представить знаки почти всех письменных языков. Предложен в 1991 году некоммерческой организацией «Консорциум Юникода». Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы.
8 Стандарт состоит из двух основных разделов: универсальный набор символов и семейство кодировок. Универсальный набор символов задаёт однозначное соответствие символов кодам. Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем.
9 Удивительно, но двоичная система кодирования предоставляет нам широкие возможности для передачи информации. В компьютерах используют двоичную систему потому, что она имеет ряд преимуществ перед другими системами: для ее реализации нужны технические устройства с двумя устойчивыми состояниями (есть ток - нет тока, намагничен - не намагничен и т. п.), а не, например, с десятью, - как в десятичной; представление информации посредством только двух состояний надежно и помехоустойчиво; двоичная арифметика намного проще десятичной. Недостаток двоичной системы - это быстрый рост числа разрядов, необходимых для записи даже относительно небольших чисел. Вывод