Включить версию для слабовидящих Персональный сайт - информатика
Размер шрифта: A A A Изображения Выключить Включить Цвет сайта Ц Ц Ц Х
Четверг, 17.08.2017, 14:48
Приветствую Вас Гость | RSS

МОУ СОСНОВСКИЙ ЦЕНТР ОБРАЗОВАНИЯ

Меню сайта
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0

информатика

А.С. Есипов
 
 
Кодирование и единицы информации
 
Языки и алфавиты
Различают естественные и искусственные (формальные) языки. Естественные языки развивались веками и служат для общения людей между собой. Формальные языки разрабатываются для специальных применений. Примером формальных языков могут служить языки программирования, языки кодирования информации для ее передачи, хранения и т.п.

  Каждый язык имеет свой алфавит. Под алфавитом языка понимают набор используемых символов. Под мощностью алфавита понимают количество составляющих алфавит символов. Кодом называют совокупность знаков (символов) предназначенных для представления информации в соответствии с определенными правилами. Такое представление называют кодированием. Кодируют информацию с целью ее передачи, хранения, преобразования. Одно и то же понятие на различных языках может кодироваться различными способами. Например, слово стол— это код в русском алфавите всем известного предмета мебели. В других языках, в других алфавитах этот предмет кодируется иначе.

 Наименьший по числу знаков алфавит имеет только один знак. Пусть этот знак 1 (единица). Тогда три цвета светофора можно закодировать, например, так: красный — 1, желтый — 11, зеленый — 111. Такой алфавит самый неэкономичный по записи кодов. В этом легко убедиться, если попытаться записать в этом алфавите, например, число десять: 1111111111 

Двоичный алфавит
В информатике и вычислительной технике широко используется алфавит, имеющий два знака — 1 и 0. Этим знакам в логике и технике приводят в соответствие понятия — да и нет, истина и ложь, включено и выключено. Такой алфавит называют двоичным или бинарным. В соответствии с этим введена и наименьшая единица информации — бит (англ. bit, от binary — двоичный и digit — знак).

 Одного бита информации достаточно, чтобы передать слово да или нет, закодировать, например, состояние электролампочки. Кстати, на некоторых выключателях пишут 1 — включено и 0 — выключено. Взгляд на выключатель снимает для нас неопределенность в его состоянии. При этом мы получаем количество информации равное одному биту.

 Двоичное слово. Байт.
Если требуется закодировать в двоичном алфавите красный, желтый и зеленый цвет светофора, то требуется уже два бита. Закодировать три цвета можно, например, так: 00, 01 и 10. Сообщение о том, что включен, например, красный цвет светофора, содержит информации больше одного бита. Для кодирования четырех сторон света (север, восток, юг и запад) требуется также два бита: 00, 01, 10, 11. Поэтому сообщение о том, какая выбрана сторона света, содержит ровно два бита информации.

При кодировании восьми углов куба потребуется три бита: 000, 001, 010, 011, 100, 101, 110, 111. При кодировании от 9 до 16 объектов потребуется уже четыре бита, от 17 до 31 — 5 бит, от 32 до 63 — 6 бит, от 64 до 127 — 7 бит.

Последовательность символов называют словом. Можно сделать вывод: чем больше требуется закодировать объектов, тем длиннее требуется двоичное слово. Восьмибитовое двоичное слово называется байтом. С помощью байта можно закодировать 256 различных объектов.
До недавнего времени байта было достаточно, чтобы закодировать все символы текста в русском и латинском алфавите: буквы, цифры, знаки препинания, управляющие сигналы — все то, что передавалось компьютеру с клавиатуры. Для этого использовался код ASCII (American Standard Coding for Information Interchange — Американский Стандартный Код для Обмена Информацией).

С развитием информатики байт начал сдерживать возможность увеличения количества используемых символов. В настоящее время завершается переход на двухбайтовое кодирование символов с использованием кода Unicode. 16-битовое двоичное слово позволяет закодировать 65536 символов и команд.

Пример 1.
При работе с текстовым редактором Microsoft Word командой Сервис | Статистика можно вывести на экран диалоговое окно Статистика (см. рис. 1).
В окне отображаются характеристики документа, загруженного в рабочее поле редактора.
Рис. 1.Окно Статистика.
 Подсчитаем объем памяти, требуемый для записи и хранения в памяти компьютера текстового документа с показанными в окне данными. Всего знаков с пробелами 40375. В коде ASCII требуется память 40375 байтов или 40375 / 1024 = 39,429 ≈ 40 килобайт. В Unicode, где каждый знак кодируется двумя байтами, потребуется память в два раза большего объема. (А.С.Есипов)
 
 

 


Copyright MyCorp © 2017