150 likes | 529 Views
К О Д И Р О В А Н И Е Т Е К С Т А. Кодирование информации. процесс формирования определенного представления информации . В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой. Обратное преобразование называют декодированием.
E N D
Кодирование информации • процесс формирования определенного представления информации. • В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой. • Обратное преобразование называют декодированием. Способ кодирования зависит от цели, ради которой оно осуществляется: сокращение записи, засекречивание (шифровка) информации, удобство обработки и т. п.
Кодирование информации в компьютере Все виды информации кодируются на машинном языке, в виде логической последовательности нулей и единиц:
Кодирование текстовой информации Процесс кодирования текстовой информации состоит в том, что каждому символу присваивается уникальный десятичный (или шестнадцатеричный) код, который затем представляется в виде двоичного. Данный код называется кодом символа. Конкретное соответствие между символами и их кодами называется системой кодировки. Каждая кодировка задается своей собственной кодовой таблицей.
Кодировка ASCII(American Standard Code for Information Interchange) Первые 33 кода (с 0 по 32) соответствуют не символам,а операциям (перевод строки, ввод пробела и т. д.) Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операцийи знакам препинания.
Кодировки русского алфавита Коды со 128 по 255 используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов (расширенные ASCII-коды). Каждое такое расширение было связано с используемой операционной системой или программным обеспечением, разрабатывавшимся в стране. Для русского языка существует пять кодовых таблиц: CP866 , CP1251, КОИ-8, ISO, Mac. Одному и тому же коду в разных кодировках соответствуют разные символы.
Кодировки русского алфавита Слово «Текст» в этой кодировке выглядит так:210 229 234 241 242
(Код Информационного Обмена 8-битный) Кодировки русского алфавита Слово «Текст» в этой кодировке выглядит так:244 197 203 211 212
Кодировки русского алфавита Все перечисленные выше кодировки являются восьмибитными и позволяют кодировать не более 256 (28) символов, что делает невозможным одновременное использование нескольких языков. Международный стандарт Unicode отводит на каждый символ не один, а два байта (16 бит), и поэтому с его помощью можно закодировать не 256, а 65536 (216) различных символов. Слово «Текст» в этой кодировке выглядит так:0422 0435 043А 0441 0442
Кодирование текстовой информации При определении информационного объема текстового сообщения следует пользоваться формулой: N = 2i N – мощность алфавита (количество символов в алфавите); i – количество бит для хранения одного символа. Слово «Текст» в 8-битной кодировке занимает 40 бит;в кодировке Unicode – 80.
Как изменится объем текста при его преобразовании из стандартной кодировки в кодировку Unicode? Сколько существует кодировок латинского алфавита? Сколько существует кодировок русского алфавита? Какой информационный объем займет слово «Текст», если его закодировать с помощью русского алфавита из 32 букв (регистр буквы имеет значение!)? ВОПРОСЫ
Увеличится в два раза. Одна. Пять. 30 бит. ОТВЕТЫ