Слайд 1Некоторые сведения об информации
(Продолжение)
ЛЕКЦИЯ 2
Слайд 2Предметное содержание информации позволяет уяснить ее основные свойства
достоверность
полноту
ценность
актуальность
понятность
конфиденциальность.
Информация достоверна,
если она не искажает истинное положение дел. Недостоверная информация может
привести к неправильному пониманию или принятию неправильных решений.
СВОЙСТВА ИНФОРМАЦИИ
Слайд 3Информация полна, если ее достаточно для понимания и принятия решений.
Неполнота информации сдерживает принятие решений или может повлечь ошибки.
Ценность
информации зависит от того, какие задачи мы можем решить с ее помощью.
При работе в постоянно изменяющихся условиях важно иметь актуальную, т. е. соответствующую действительности, информацию.
Информация становится понятной, если она выражена языком, доступным людям, для которых она предназначена.
Информация конфиденциальна, если доступ к ней ограничен в соответствии с законодательством страны и уровнем доступа к информационному ресурсу. Конфиденциальная информация становится доступной или раскрытой только санкционированным лицам, объектам или процессам
Слайд 4Какое количество информации содержится, к примеру, в тексте романа "Война
и мир", в картинах Леонардо да Винчи или в генетическом
коде человека?
Ответа на эти вопросы наука не даёт и, по всей вероятности, даст не скоро.
А возможно ли объективно измерить количество информации? Важнейшим результатом теории информации является следующий вывод:
В определенных, весьма широких условиях можно пренебречь качественными особенностями информации, выразить её количество числом, а также сравнить количество информации, содержащейся в различных группах данных.
ИЗМЕРЕНИЕ ИНФОРМАЦИИ
ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ
Слайд 5Различают следующие подходы к измерению информации:
статистический. Учитывает вероятность появления сообщений:
более информативным считается то сообщение, которое менее вероятно, т.е. менее
всего ожидалось. Применяется при оценке значимости получаемой информации.
семантический. Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.
структурный. Измеряет количество информации простым подсчетом информационных элементов, составляющих сообщение. Применяется для оценки возможностей запоминающих устройств компьютеров, объемов передаваемых сообщений, инструментов кодирования без учета статистических характеристик их эксплуатации.
Слайд 6т.е., информация уменьшает степень неопределенности, неполноту знаний о лицах, предметах,
событиях и т.д.
В обиходе информацией называют любые данные или сведения,
которые кого-либо интересуют.
Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.
"Информировать" в этом смысле означает «сообщить нечто, неизвестное раньше».
Клод Шеннон, американский учёный, заложивший основы теории информации, рассматривает информацию как снятую неопределенность наших знаний о чем-то.
Статистический подход к измерению информации
Слайд 7Американский инженер Р. Хартли в 1928 г. процесс получения информации
рассматривал как выбор одного сообщения из конечного наперёд заданного множества
из N равновозможных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял по следующей формуле
Формула Хартли: I = log2N
Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется:
I = log2100 > 6,644.
Таким образом, сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единицы информации.
Формулы Хартли и Шеннона
Слайд 8Приведем другие примеры равновозможных сообщений:
при бросании монеты: "выпала решка",
"выпал орел";
на странице книги: "количество букв чётное", "количество букв
нечётное".
Определим теперь, являются ли равновероятными сообщения "первой выйдет из дверей здания женщина" и "первым выйдет из дверей здания мужчина".
Однозначно ответить на этот вопрос нельзя. Все зависит от того, о каком именно здании идет речь. Если это, например, здание ТГАСУ, то вероятность выйти из дверей первым одинакова для мужчины и женщины, а если это военная казарма, то для мужчины эта вероятность значительно выше, чем для женщины.
Слайд 9
.Для задач такого рода американский учёный Клод
Шеннон предложил в 1948 г. другую формулу определения количества информации,
учитывающую возможную неодинаковую вероятность сообщений в наборе.
Формула Шеннона:
I = — ( p1log2 p1 + p2 log2 p2 + . . . + pN log2 pN),
где pi — вероятность того, что именно i-е сообщение выделено в наборе из N сообщений.
Легко заметить, что если вероятности p1, ..., pN равны, то каждая из них равна 1 / N, и формула Шеннона превращается в формулу Хартли.
Слайд 10В непрозрачном мешочке находится 50 белых, 25 красных, 25 синих
шаров.
Какое количество информации будет содержать сообщение о цвете вынутого
шара.
1) всего шаров 50+25+25=100
2) вероятности вынуть шар
белого цвета 50/100=1/2,
красного цвета 25/100=1/4,
синего цвета 25/100=1/4
3) По формуле Шеннона количество информации о цвете вынутого шара
I= -(1/2 log21/2 + 1/4 log21/4 + 1/4 log21/4) = 1,5
В корзине лежит 16 шаров разного цвета. Сколько информации несет сообщение, что достали белый шар?
Т.к. N = 16 шаров, то по формуле Хартли
I = log2 N = log2 16 = 4
Слайд 11
В качестве единицы информации Клод Шеннон предложил принять один бит
(англ. bit — binary digit — двоичная цифра).
Бит
в теории информации — количество информации, необходимое для различения двух равновозможных сообщений (типа "орел"—"решка", "чет"—"нечет" и т.п. N=2).
1Бит=log22
Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица байт
1 Байт=8 Бит
В информатике битом называют наименьшую "порцию" памяти компьютера, необходимую для хранения одного из двух знаков "0" и "1", используемых для кодирования данных и команд.
1 Бит – двоичный знак двоичного алфавита 0,1.
Слайд 12Широко используются также ещё более крупные производные единицы информации:
1
Килобайт (Кбайт) = 1024 байт = 210 байт,
1 Мегабайт
(Мбайт) = 1024 Кбайт = 220 байт,
1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.
В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:
1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,
1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.
Начинают использоваться следующие единицы информации
1 эксобайт=1024 Тбайт=260байт
1 зеттабайт=1024 эксобайт=270 байт
1 йоттабайт=1024 зеттабайт=280 байт
Слайд 14В процессе передачи или хранения информации часто приходится переходить от
одного способа представления информации к другому, то есть с одного
языка на другой.
Преобразование символов одного алфавита в символы другого алфавита, выполненное по определенным правилам, называется кодированием (от латинского слова codex — свод законов), а результат этого преобразования — кодом.
.
Слайд 15Присвоение символу определенного кода – это вопрос соглашения, которое фиксируется
в кодовой таблице.
В качестве международного стандарта ранее была принята
кодовая таблица ASCII (American Standard Code for Information Interchange).
Для кодировки 1 символа текста (буквы, цифры, знаки препинания, включая пробел и другие знаки для операций с текстами) отводился 1 байт (8 бит), всего можно закодировать 28 = 256 символов
N=2i N – мощность алфавита
28=256 I – информационный вес
Каждому символу десятичного кода от 0 до 255 или соответствовал двоичный код от 00000000 до 11111111
ДВОИЧНОЕ КОДИРОВАНИЕ ТЕКСТА
Слайд 17Декодировать текст с помощью кодовой таблицы ASCII:
99 111
109 112 117 116 101
114
computer
Слайд 18Коды с 0 по 32 (первые 33 кода) - коды
операций (перевод строки, ввод пробела, т.е. соответствуют функциональным клавишам);
Коды с
33 по 127 – интернациональные, соответствуют символам латинского алфавита, цифрам, знакам арифметических операций, знакам препинания;
Коды с 128 по 255 – национальные, т.е. кодировка национального алфавита.
В настоящее время существует 5 кодовых таблиц для русских букв:
Windows - 1251,
MS – DOS 866,
KOИ8-R
ISO (OS UNIX).
Слайд 19С 1997 года появился новый международный стандарт Unicode, который отводит
для кодировки одного символа, как правило 2 байта (16 бит),
и можно закодировать 65536 различных символов.
N=2I=216=65 536 – мощность алфавита
i=16 - информационный вес
Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, множество математических, музыкальных, химических и прочих символов)
Слайд 20Есть два основных формата кодирования чисел. Один из них используется
для кодирования целых чисел, второй (так называемое представление числа в
формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел с дробной частью).
Чтобы получить внутреннее представление целого положительного числа N нужно:
1) перевести число N в двоичную систему счисления;
2) полученный результат дополнить слева незначащими нулями до выбранного разряда.
Например, для получения внутреннего представления целого числа 1607 в 2-х байтовой коде (16 разрядов) число переводится в двоичную систему: 160710 = 110010001112. Внутреннее представление этого числа в этом коде имеет вид:
0000 0110 0100 0111.
Чаще всего используется 4 байтное представление целых чисел (4*8=32 бит или 32 двоичных разряда) в памяти компьютера.
Кодирование чисел
Слайд 21Для записи внутреннего представления целого отрицательного числа (–N) нужно:
1) получить
внутреннее представление положительного числа N;
2) получить обратный код этого числа,
заменяя 0 на 1 и 1 на 0;
3) прибавить 1 к полученному числу.
Внутреннее представление целого отрицательного числа –1607. С использованием результата предыдущего примера и записывается внутреннее представление положительного числа 1607:
0000 0110 0100 0111.
Обратный код получается инвертированием (заменой 0 на 1 и 1 на 0) :
1111 1001 1011 1000.
Добавляется единица: 1111 1001 1011 1001 – это и есть внутреннее двоичное представление числа –1607.
Поскольку для хранения целых чисел в памяти компьютера отводится ячейка 4 байта (32 разряда), то диапазон представления целых чисел (по модулю)
от 0 до 2 147 483 647 (231-1)
Слайд 22Вещественные числа(числа с дробной десятичной частью) хранятся и обрабатываются в
компьютере в формате с плавающей запятой, использующем экспоненциальную форму записи
чисел.
Число в экспоненциальной форме представляется в виде
A = m • qn
где m — мантисса числа (правильная, отличная от нуля десятичная дробь);
q — основание системы счисления (для десятичной системы q=10);
n — порядок числа.
Например, 587.26=0.58726⋅103
- 0.0000209= - 0.209 ⋅10-4
Число в формате с плавающей запятой может занимать в памяти 4 байта (обычная точность) или 8 байт (двойная точность).
При записи числа выделяются разряды для хранения знака мантиссы, знака порядка, а также порядка и мантиссы. Две последние величины определяют диапазон изменения чисел и их точность.
Слайд 24Кодирование
графической информации
Графическая информация
может быть представлена в
аналоговой (непрерывной) и дискретной форме
живописное полотно
цифровая фотография
Слайд 26
Примером аналогового представления информации может служить живописное полотно,
цвет которого
изменяется непрерывно
Слайд 27Дискретное изображение состоит
из отдельных точек
Лазерный принтер
струйный принтер
Слайд 28Преобразование изображения из аналоговой
(непрерывной) в цифровую (дискретную) форму
называется
пространственной дискретизацией
Аналоговая форма
Дискретная форма
сканирование
Слайд 29В процессе пространственной дискретизации
изображение разбивается на отдельные
маленькие фрагменты,
точки - пиксели
пиксель
Слайд 30Пиксель – минимальный участок изображения,
для которого независимым образом можно
задать цвет.
В результате пространственной дискретизации графическая информация представляется в виде
растрового изображения.
Слайд 31Разрешающая способность растрового изображения определяется количеством точек по горизонтали и
вертикали на единицу длины изображения.
Слайд 32Чем меньше размер точки, тем больше разрешающая способность, а значит,
выше качество изображения.
Величина разрешающей способности выражается в dpi
(dot per
inch – точек на дюйм), т.е. количество точек в полоске изображения длиной один дюйм (1 дюйм=2,54 см.)
Слайд 33Количество информации, которое используется
для кодирования цвета точки изображения,
называется
глубиной цвета.
В процессе дискретизации используются
различные палитры цветов (наборы цветов,
которые могут принять точки изображения).
Количество цветов N в палитре и количество информации I, необходимое для кодирования цвета каждой точки, могут быть вычислены по формуле:
N=2I
Слайд 34Пример:
Для кодирования черно-белого изображения (без градации серого) используются всего два
цвета – черный и белый. По формуле N=2I можно
вычислить, какое количество информации необходимо, чтобы закодировать цвет каждой точки:
2=2I
2=21
I=1 бит
Для кодирования одной точки черно-белого изображения достаточно 1 бита.
Слайд 35Зная глубину цвета, можно вычислить количество цветов в палитре.
Глубина цвета
и количество цветов в палитре
Слайд 36Решение: 16 = 24 ; 10*10*4 = 400 бит
Задачи
1.
Растровый графический файл содержит черно-белое изображение с 16 градациями серого
цвета размером 10х10 пикселей. Каков информационный объем этого файла?
2. 256-цветный рисунок содержит 120 байт информации. Из скольких точек он состоит?
Решение:
120 байт = 120*8 бит;
256 = 28 (8 бит – 1 цвет 1 точки).
120*8/8 = 120 точек
Слайд 37Качество растрового изображения зависит от:
1) разрешающей способности монитора –
кол-во точек по вертикали и горизонтали.
2) используемой палитры цветов
(16, 256, 65536 цветов)
3) глубины цвета – количество бит для кодирования цвета точки
Цветные изображения формируются в соответствии с двоичным кодом цвета, который хранится в видеопамяти. Цветные изображения имеют различную глубину цвета. Цветное изображение на экране формируется за счет смешивания трех базовых цветов – красного, зеленого и синего (RGB модель).
Слайд 38Цвет палитры Color можно определить с помощью формулы:
Color = R + G +
В
При этом надо учитывать глубину цвета — количество битов, отводимое в компьютере для кодирования цвета.
Для глубины цвета 24 бита (8 бит на каждый цвет):
0 ≤ R ≤ 255, 0 ≤ G ≤ 255, 0 ≤ B ≤ 255
Слайд 39Формирование цветов в системе цветопередачи RGB
Цвета в палитре RGB формируются
путём сложения базовых цветов, каждый из которых может иметь различную
интенсивность.
Слайд 40Система цветопередачи RGB применяется в мониторах компьютеров, в телевизорах и
других излучающих свет технических устройствах.
Слайд 41Палитра цветов в системе цветопередачи CMYK
В системе цветопередачи CMYK палитра
цветов формируется путём наложения голубой, пурпурной, жёлтой и черной красок
Смешение
трех красок – голубой, желтой и пурпурной – должно приводить к полному поглощению света, и мы должны увидеть черный цвет. Однако на практике вместо черного цвета получается грязно-бурый цвет.
Поэтому в цветовую модель добавляют еще один, истинно черный цвет – blacК.
Расширенная палитра получила название CMYK.
Система цветопередачи CMYK применяется
в полиграфии.