Слайд 1Подходы к понятию информации и измерению.
Слайд 2Основные подходы к определению понятия «информация»
Виды и свойства информации.
Кодирование информации.
Языки кодирования.
Представление информации в двоичной системе счисления. Количество и
размер информации. Единицы измерения информации.
Основные вопросы:
Слайд 3Термин “Информация”
происходит от латинского слова informatio – пояснение, разъяснение.
Слайд 4Информация - это сведения об объектах и явлениях окружающей среды, их
параметрах, свойствах и состоянии, которые воспринимают информационные системы (живые организмы,
управляющие машины и др.) в процессе жизнедеятельности и работы.
Слайд 5Информация – это …
любые сведения об окружающем мире, которые человек
получает с помощью органов чувств:
глаза (зрение, 90 процентов информации)
уши (слух)
язык
(вкус)
нос (обоняние)
кожа (осязание)
Слайд 6Человек получает информацию с помощью органов чувств
ЗРЕНИЕ
СЛУХ
ОБОНЯНИЕ
ОСЯЗАНИЕ
ВКУС
Слайд 8Информация-третья фундаментальная величина
Слайд 10По способу восприятия
Визуальная
Тактильная
(осязание)
Аудиальная
Вкусовая
Обонятельная
Слайд 11По форме представления
Текстовая
Графическая
Звуковая
Числовая
Слайд 12По назначению
Массовая - содержит обычные сведения и оперирует набором понятий,
понятных большинству
Специальная - содержит специфический набор понятий , понятных в
рамках узкой социальной группы
Секретная - передаваемая узкому кругу лиц и по закрытым (защищенным) каналам
Личная (приватная) - набор сведений о какой-либо личности.
Слайд 13Актуальная (актуальность)
информация , ценная в данный момент времени
Достоверная (достоверность)
информация ,
полученная без искажений
Полная (полнота)
информация , достаточная для принятия правильного решения
или понимания
Понятная (понятность)
информация , выраженная на языке, понятном тому, кому она предназначена
Полезная (полезность)
Определяется субъектом, получившим информацию в зависимости от возможности ее использования
Свойства информации:
Точная (точность)
Определяется степенью ее близости к реальному состоянию объекта, процесса, явления и т. п.
Слайд 14Кодирование информации. Языки кодирования. Универсальность дискретного(цифрового) представления информации
Слайд 15
Для представления и обмена информацией между людьми служат языки
Естественные
Возникшие
в результате исторического развития
Формальные
Созданные искусственно человеком для решения различных задач
Слайд 16Код – набор символов (условных обозначений) для представления информации.
Кодирование –
процесс представления информации (сообщения) в виде кода.
Декодирование – процесс
обратного преобразования кода к форме исходной символьной системы, т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке.
Кодирование информации
– это запись информации с помощью некоторой знаковой системы (языка).
Слайд 17Двоичное кодирование в компьютере
Вся информация, которую обрабатывает компьютер должна быть
представлена двоичным кодом с помощью двух цифр: 0 и 1.
Эти два символа принято называть двоичными цифрами или битами.
Слайд 18Кодирование символов
Текстовый файл
на экране (символы)
в памяти – двоичные
коды
Слайд 191 символ – 1 байт (8 бит)
Для кодирования одного символа
требуется один байт информации.
Учитывая, что каждый бит принимает значение 1
или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов.
28=256
Слайд 20Двоичное кодирование текстовой информации
Кодирование заключается в том, что каждому символу
ставиться в соответствие уникальный двоичный код от 00000000 до 11111111
(или десятичный код от 0 до 255).
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.
Слайд 21Таблица кодировки
Таблица, в которой всем символам компьютерного алфавита поставлены в
соответствие порядковые номера (коды), называется таблицей кодировки.
Для разных типов ЭВМ
используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.
Слайд 22Таблица кодировки ASCII
Стандартной в этой таблице является только первая половина,
т.е. символы с номерами от 0 (00000000) до 127 (0111111).
Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.
В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).
В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.
Слайд 24Измерение информации: содержательный подход
Слайд 25Для человека информация — это знания человека.
Получение новой информации
приводит к расширению знаний.
Если некоторое сообщение приводит к уменьшению
неопределенности нашего знания, то можно говорить, что такое сообщение содержит информацию.
Отсюда следует вывод, что сообщение информативно (т.е. содержит ненулевую информацию), если оно пополняет знания человека.
Нетрудно понять, что информативность одного и того же сообщения может быть разной для разных людей.
Например: «2x2=4» информативно для первоклассника, изучающего таблицу умножения, и неинформативно для старшеклассника.
Слайд 26Информативность сообщения
Но для того чтобы сообщение было информативно оно должно
еще быть понятно.
Быть понятным, значит быть логически связанным с
предыдущими знаниями человека.
Получение всяких знаний должно идти от простого к сложному. И тогда каждое новое сообщение будет в то же время понятным, а значит, будет нести информацию для человека.
Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными.
Слайд 27Единица измерения информации
Очевидно, различать лишь две ситуации: «нет информации» —
«есть информация» для измерения информации недостаточно. Нужна единица измерения, тогда
мы сможем определять, в каком сообщении информации больше, в каком — меньше.
Единица измерения информации была определена в науке, которая называется теорией информации. Эта единица носит название «бит». Ее определение звучит так:
Сообщение, уменьшающее неопределенность знаний в два раза, несет 1 бит информации.
Неопределенность знаний о некотором событии — это количество возможных результатов события.
Слайд 28Формула вычисления кол-ва информации
Если обозначить возможное количество событий, или, другими
словами, неопределенность знаний N, а буквой I - количество информации
в сообщении о том, что произошло одно из N событий, то можно записать формулу:
2I = N
Слайд 29Измерение информации: алфавитный подход
Слайд 30Способ измерения информации, который не связывает количество информации с содержанием
сообщения, называется алфавитным подходом.
При алфавитном подходе к определению количества информации
отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Слайд 31Алфавит – набор знаков, используемых при кодировании информации с помощью
некоторого языка.
Примеры:
АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ 32
ABCDEFGHIJKLMNOPQRSTUVWXYZ 26
×
O 2
0123456789 10
Мощность алфавита (N) – полное количество символов алфавита.
Алфавитный подход
мощность алфавита
информационная емкость символа
Слайд 32Алфавитный подход
Задача. Определить объем информации в сообщении
ПРИВЕТВАСЯ
для кодирования которого
используется русский алфавит (только заглавные буквы).
Ответ: 10·5 бит = 50
бит
считаем все символы (здесь 10 символов)
мощность алфавита – 32 символа (32=25)
1 символ несет 5 бит информации
Решение:
Слайд 33Количество информации в тексте
А теперь для того, чтобы найти количество
информации во всем тексте, нужно посчитать число символов в нем
и умножить на I.
Посчитаем количество информации на одной странице книги.
Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50x60=3000 знаков.
Тогда объем информации будет равен:
5,755 х 3000 = 17265 бит.
При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.
Слайд 34Задача:
Определите информационный объем страницы книги, если для записи текста использовались
только заглавные буквы русского алфавита, кроме буквы Ё.
Решение:
N = 32
2I
= N
2I = 32
I = 5
На странице 3000 знаков, тогда объем информации = 3000 * 5 = 15000 бит.
Слайд 35Достаточный алфавит
Удобнее всего измерять информацию, когда размер алфавита N равен
целой степени двойки.
Например, если N=16, то каждый символ несет
4 бита информации потому, что 24 = 16. А если N =32, то один символ «весит» 5 бит.
Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы скоро встретимся при работе с компьютером. Это алфавит мощностью 256 символов.
В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания....
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт.
1 байт = 8 бит
Слайд 36Количество информации в тексте
Сегодня очень многие люди для подготовки писем,
документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные
редакторы, в основном, работают с алфавитом размером 256 символов.
В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.
Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов.
Значит страница содержит 40x60=2400 байт информации.
Объем всей информации в книге: 2400 х 150 = 360 000 байт.
Слайд 39Группа из 8 бит называется байтом
(byte – binary term –
двоичный элемент)
Байт – основная единица измерения информации, занесенная в систему
СИ