Слайд 1Кодирование и обработка текстовой информации.
Слайд 2Кодирование и декодирование текстовой информации
Для кодирования букв русского и латинского
алфавита, цифр, ряда спец. знаков достаточно использовать 256 различных символов.
По формуле, связывающей количество сообщений N и количество информации I, можно вычислить, какое количество информации необходимо для кодирования каждого знака.
N =2I => 256 = 2I => 28 = 2I => I = 8 битов = 1 байт
Слайд 3Кодирование заключается в том, что каждому символу ставится в соответствие
уникальной десятичный код от 0 до 255 или соответствующий или
соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер – по их коду.
Слайд 4При вводе в компьютер текстовой информации происходит её двоичное кодирование,
изображение символа преобразуется в его двоичный код. Пользователь нажимает на
клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.
В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т. е. преобразование кода символа в его изображение.
Слайд 5Кодировки русского алфавита
Важно, что присваивание символу конкретного кода- это вопрос
соглашения, которое фиксируется в кодовой таблице. Первые 33 кода(с 0
по 32) этой таблицы соответствует не символам, а операциям(перевод строки, ввод пробела и так далее).
Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Слайд 6Коды с 128 по 255 являются национальными, то есть в
национальных кодировках одному и тому же коду соответствуют различные символы.
Существуют 5 однобайтовых кодовых таблиц для русских букв(WINDOWS, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
Слайд 7В настоящее время широкое распространение получил новый международный стандарт Unicode,
который отводит на каждый символ не один байт, а два,
и потому с его помощью можно закодировать не 256 символов, а N=216 = 65536 различных символов. Такого количества символов достаточно для кодировки не только русского и латинского алфавита, цифры, знаки и математические символы, но и другие алфавиты.