МЕЖДУНАРОДНЫЕ СИСТЕМЫ БАЙТОВОГО КОДИРОВАНИЯ - Кодирование информации
Информатика и ее приложения интернациональны. Это связано как с объективными потребностями человечества в единых правилах и законах хранения, передачи и обработки информации, так и с тем, что в этой сфере деятельности (особенно в ее прикладной части) заметен приоритет одной страны, которая благодаря этому получает возможность "диктовать моду".
Компьютер считают универсальным преобразователем информации. Тексты на естественных языках и числа, математические и специальные символы - одним словом все, что в быту или в профессиональной деятельности может быть необходимо человеку, должно иметь возможность быть введенным в компьютер.
В силу безусловного приоритета двоичной системы счисления при внутреннем представлении информации в компьютере кодирование "внешних" символов основывается на сопоставлении каждому из них определенной группы двоичных знаков. При этом из технических соображений и из соображений удобства кодирования-декодирования следует пользоваться равномерными кодами, т. е. двоичными группами равной длины.
Попробуем подсчитать наиболее короткую длину такой комбинации с точки зрения человека, заинтересованного в использовании лишь одного естественного алфавита - скажем, английского: 26 букв следует умножить на 2 (прописные и строчные) - итого 52; 10 цифр, будем считать, 10 знаков препинания; 10 разделительных знаков (три вида скобок, пробел и др.), знаки привычных математических действий, несколько специальных символов (типа #, $, &; и др.) -- итого ~ 100. Точный подсчет здесь не нужен, поскольку нам предстоит решить простейшую задачу: имея, скажем, равномерный код из групп по N двоичных знаков, сколько можно образовать разных кодовых комбинаций. Ответ очевиден К = 2N. Итак, при N = 6 К = 64 - явно мало, при N = 7 К = 128 - вполне достаточно.
Однако, для кодирования нескольких (хотя бы двух) естественных алфавитов (плюс все отмеченные выше знаки) и этого недостаточно. Минимально достаточное значение N в этом случае 8; имея 256 комбинаций двоичных символов, вполне можно решить указанную задачу. Поскольку 8 двоичных символов составляют 1 байт, то говорят о системах "байтового" кодирования.
Наиболее распространены две такие системы: EBCDIC (Extended Binary Coded Decimal Interchange Code) и ASCII (American Standard Information Interchange).
Первая - исторически тяготеет к "большим" машинам, вторая чаще используется на мини - и микро-ЭВМ (включая персональные компьютеры). Ознакомимся подробнее именно с ASCII, созданной в 1963 г.
В своей первоначальной версии это - система семибитного кодирования. Она ограничивалась одним естественным алфавитом (английским), цифрами и набором различных символов, включая "символы пишущей машинки" (привычные знаки препинания, знаки математических действий и др.) и "управляющие символы". Примеры последних легко найти на клавиатуре компьютера: для микро-ЭВМ, например, DEL - знак удаления символа.
В следующей версии фирма IBM перешла на расширенную 8-битную кодировку. В ней первые 128 символов совпадают с исходными и имеют коды со старшим битом равным нулю, а остальные коды отданы под буквы некоторых европейских языков, в основе которых лежит латиница, греческие буквы, математические символы (скажем, знак квадратного корня) и символы псевдографики. С помощью последних можно создавать таблицы, несложные схемы и др.
Для представления букв русского языка (кириллицы) в рамках ASCII было предложено несколько версий. Первоначально был разработан ГОСТ под названием КОИ-7, оказавшийся по ряду причин крайне неудачным; ныне он практически не используется.
В табл. 1.9 приведена часто используемая в нашей стране модифицированная альтернативная кодировка. В левую часть входят исходные коды ASCII; в правую часть (расширение ASCII) вставлены буквы кириллицы взамен букв, немецкого, французского алфавитов (не совпадающих по написанию с английскими), греческих букв, некоторых спецсимволов.
Знакам алфавита ПЭВМ ставятся в соответствие шестнадцатиричные числа по правилу: первая - номер столбца, вторая - номер строки. Например: английская 'А' - код 41, русская 'и' - код А8.
Таблица 1.9
Таблица кодов ASCII (расширенная)
Одним из достоинств этой системы кодировки русских букв является их естественное упорядочение, т. е. номера букв следуют друг за другом в том же порядке, в каком сами буквы стоят в русском алфавите. Это очень существенно при решении ряда задач обработки текстов, когда требуется выполнить или использовать лексикографическое упорядочение слов.
Из сказанного выше следует, что даже 8-битная кодировка недостаточна для кодирования всех символов, которые хотелось бы иметь в расширенном алфавите. Все препятствия могут быть сняты при переходе на 16-битную кодировку Unicode, допускающую 65536 кодовых комбинаций.
Похожие статьи
-
Эффективное кодирование - Основы построения телекоммуникационных систем и сетей
Эффективное кодирование - это процедуры направленные на устранение избыточности. Основная задача эффективного кодирования: обеспечить, в среднем,...
-
Системы исчисления - Кодирование информации в микропроцессорных системах
Любое неотрицательное число в позиционной системе счисления может быть представлено в виде: Где А - основание системы счисления, Х I - разряды (числа от...
-
КОДИРОВАНИЕ ИНФОРМАЦИИ., АБСТРАКТНЫЙ АЛФАВИТ - Кодирование информации
АБСТРАКТНЫЙ АЛФАВИТ Информация передается в виде сообщений. Дискретная информация записывается с помощью некоторого конечного набора знаков, которые...
-
КОДИРОВАНИЕ ИНФОРМАЦИИ В ЭВМ, СИСТЕМЫ СЧИСЛЕНИЯ - Цифровые устройства и микропроцессоры
СИСТЕМЫ СЧИСЛЕНИЯ В позиционных СС "вес" каждого разряда зависит от его позиции в числе. К числу непозиционных относится "римская" СС, например число -...
-
В результате сравнения производителей систем передач были выбраны две наиболее подходящие это система Cisco ONS 15808 и система ПУСК, выпущенная в России...
-
Принципы построения ВОСПИ Оптические волокна производятся разными способами, они обеспечивают передачу оптического излучения на разных длинах волн, имеют...
-
Кодирование в системах ПДС, Классификация кодов - Техника передачи дискретных сообщений
Классификация кодов Эффективное кодирование - это процедуры направленные на устранение избыточности (т. е. минимизировать количество элементов,...
-
ОБНАРУЖЕНИЕ И ИСПРАВЛЕНИЕ ОШИБОК В СООБЩЕНИЯХ - Теория и практика информации и кодирования
Задача 4 1. Чему равно кодовое расстояние между комбинацией 10010111 и комбинациями 11111111, 00000000, 00010111? Решение Для того чтобы определить...
-
Классификация кодов Эффективное кодирование - это процедуры направленные на устранение избыточности (т. е. минимизировать количество элементов,...
-
Места формирования и потребления информации - Логистические системы и логистическая стратегия
Прежде всего, на наш взгляд, следует отметить тот факт, что управление функциями глобального распределения, а также потоком материалов и информации...
-
Основы линейного кодирования. Полученный в результате квантования и двоичного кодирования цифровой поток оптимален с точки зрения ошибок квантования, но...
-
Весовые коэффициенты 32768 16384 8192 4096 2048 1024 512 256 128 64 32 16 8 4 2 1 1 0 0 0 1 1 1 1 0 1 Микропроцессоры обрабатывают упорядоченные двоичные...
-
Анализ путей решения поставленной задачи Постановка задачи следующая: необходимо в несколько раз повысить пропускную способность магистральной ВОЛС...
-
Учитывая все вышеперечисленное, можно сделать вывод, что при коротких линиях аналоговых ВОСПИ для исключения искажений сигнала необходимо использовать...
-
Разработка функциональной схемы опорного пункта (ОП) Оборудование выполнено в виде стоек, устанавливаемых в пунктах волоконно-оптической линии передачи:...
-
Значение международных коридоров велико не только в коммерческой стороне вопроса, но и в экономической, военной, промышленной, демографической и...
-
Метод временного мультиплексирования (TDM) Суть TDM: процесс передачи разбивается на ряд временных циклов, каждый из которых в свою очередь разбивается...
-
Оценка оптических несущих. Целью данного пункта является определения промежуточных частот и расстояния между соседними каналами. Рассмотрим подробно 3-е...
-
Выбор типа источника излучения и фотоприемника, их параметры Выбор типа источника излучения. Общие требования к источникам излучения ВОСП следующие: л...
-
ПОНЯТИЕ О ТЕОРЕМАХ ШЕННОНА - Кодирование информации
Ранее отмечалось, что при передаче сообщений по каналам связи могут возникать помехи, способные привести к искажению принимаемых знаков. Так, например,...
-
Пакет Teamcenter Engineering (ранее известный как IMAN) предназначен для поддержки жизненного цикла изделий на ранних стадиях: от концептуального...
-
Аналого-цифровые преобразователи (АЦП) являются устройствами, которые принимают входные аналоговые сигналы и генерируют соответствующие им цифровые...
-
Клавиатура - основное устройство для ввода информации. - Понятие экспертных систем (ЭС)
Существуют также устройства, облегчающие работу оператора, такие, как мышь, световое перо и пр. Также для ввода информации широко используются сканеры....
-
Эффективное кодирование - Техника передачи дискретных сообщений
Эффективное кодирование - это процедуры направленные на устранение избыточности. Основная задача эффективного кодирования: обеспечить, в среднем,...
-
ВВЕДЕНИЕ, Системы визуального отображения информации (видеосистемы) - Внешние устройства ЭВМ
Персональный компьютер (ПК)- это не один электронный аппарат, а Небольшой комплекс взаимосвязанных устройств, каждое из которых выполняет определенные...
-
В связи с тем, что питание измерительных приборов осуществляется от сети напряжением 220 В и не исключается возможность одновременного прикосновения...
-
ПУ усиливает электрический сигнал, обеспечивая наибольшее отношение сигнал/шум. Основные требования, предъявляемые к ПУ - минимальные шумы, максимальный...
-
Ввиду того, что сравнить экономический расчет не представляется возможным. Оценку данной системы передачи можно дать лишь на стадии промышленного...
-
СЖАТИЕ ИНФОРМАЦИИ - Теория и практика информации и кодирования
Задача 6 Восстановить исходный массив чисел по следующему ниже сжатому массиву: 2 4 6 8 1 3 5 7 7 2 1 Решение Сжатый массив: 2 4 6 8 1 3 5 7 7 2 1...
-
Выходной каскад для согласования с внешней нагрузкой выполнен по схеме эмиттерного повторителя. При этом RН=50 Ом и ток покоя выбирается достаточно...
-
Второй эксперимент проводился аналогично первому, только фиксировалось допустимое вносимое затухание в линию в зависимости от скорости передаваемой...
-
Выбор оборудования WDM Обзор аппаратуры фирм, выпускающих оборудование DWDM. Tехнология DWDM (Dense Wavelength Division Multiplexing) обеспечивает...
-
Введение - Проектирования магистральной волоконно-оптической системы передачи информации
В настоящее время системы связи стали одной из основ развития общества. Рост потребностей в передаче информации привлек к тому что в конце 1990-х годов...
-
Анализируя исходные данные технического задания: скорость передачи 10 Гбит/с и л=1550 нм, можно сделать вывод, что система передачи подходит под уровень...
-
При выборе сетевой магистрали, необходимо принимать во внимание следующие моменты: 1) соответствие стандартам -- совместная работу и взаимозаменяемость...
-
Выбор рабочей длины волны Форма и длительность оптических импульсов. Оптические импульсы характеризуются зависимостью: P(t)=P0F(t) Длительность импульсов...
-
Состав и назначение квантово-электронного модуля (КЭМ). Для повышения надежности и снижения требований к условиям эксплуатации и монтажа источники и...
-
ЛИТЕРАТУРА - Аналого-цифровые преобразователив системах передачи и преобразования информации
Лидовский В. И. Теория информации. - М., "Высшая школа", 2002г. - 120с. Метрология и радиоизмерения в телекоммуникационных системах. Учебник для ВУЗов. /...
-
Параллельные АЦП - Аналого-цифровые преобразователив системах передачи и преобразования информации
АЦП этого типа осуществляют квантование сигнала одновременно с помощью набора компараторов, включенных параллельно источнику входного сигнала. На рис. 3...
-
Экспериментальные исследования искажений сигнала производились двухмодовым и одномодовым методами. В качестве регистрирующей аппаратуры использовался...
МЕЖДУНАРОДНЫЕ СИСТЕМЫ БАЙТОВОГО КОДИРОВАНИЯ - Кодирование информации