Кодирование информации. Представление информации в компьютере - Особенности процесса кодирования информации. Характеристика и виды инструментального программного обеспечения. Основные операции с файлами и папками

Кодирование информации -- процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки.

В теории кодирования -- отображение передаваемых данных на кодовые слова.

В теории передачи данных -- преобразование знаков в сигналы.

Представление информации в компьютере отличается от того представления информации, которое мы используем при ежедневном общении.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&;" и т. п. и даже пробелы между словами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов - это вполне достаточное количество для представления самой разнообразной символьной информации.

Рассмотрим принципы перевода целых чисел из десятичной системы в двоичную. Основное правило: необходимо делить исходное число на 2 до тех пор, пока получившееся частное не станет меньше делителя. Если при делении получается остаток, получим разряд - единицу. Если остатка нет, то разряд - 0.

Для наглядности, переведем в двоичную систему число 156:

    1. 156 / 2 = 78 (0); 2. 78 / 2 = 39 (0); 3. 39 / 2 = 19 (1); 4. 19 / 2 = 9 (1); 5. 9 / 2 = 4 (1); 6. 4 / 2 = 2 (0); 7. 2/ 2 = 1 (0);

Итого получаем, что число 156 в двоичной системе счисления будет представлено как 0011100.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. Для разных типов ЭВМ используются различные таблицы кодировки.

Международным стандартом для ПК стала таблица ASCII (Американский стандартный код для информационного обмена).

Таблица кодов ASCII делится на две части. Международным стандартом является лишь первая половина таблицы, т. е. символы с номерами от 0 (00000000), до 127 (01111111).

Табл. 1. Первая половина таблицы кодов ASCII

Для букв русского алфавита также соблюдается принцип последовательного кодирования.

Табл. 2. Вторая половина таблицы кодов ASCII

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Похожие статьи




Кодирование информации. Представление информации в компьютере - Особенности процесса кодирования информации. Характеристика и виды инструментального программного обеспечения. Основные операции с файлами и папками

Предыдущая | Следующая