Слайд 1Дискретный анализ
Лекция 2
Наборы из нулей и единиц
Слайд 2Трактовки наборов из k нулей и единиц
Вершина куба
Характеристический вектор множества
Набор
булевых значений
Картинка
Двоичное представление целого числа
Состояние памяти компьютера
Символ кодировки
Путь в целочисленной
решетке
Результаты случайных испытаний (например, бросаний монеты)
И другие, более сложные.
Слайд 3Вершина куба
Начнем с того, что набор из k нулей и
единиц можно трактовать как вершину k–мерного единичного куба, у которого
одна из вершин находится в начале координат, а исходящие из нее ребра лежат на координатных осях.
Такой куб легко представить себе для k, равного 1, 2 и 3, а для больших размерностей все «выглядит аналогично».
Слайд 4Вершина куба-2
Вы видите здесь кубы для первых трех размерностей. Попробуйте
сами нарисовать куб размерности 4 и 5.
Отмечу, что такое представление
0-1 наборов оказалось очень полезным.
Слайд 5Вершина куба-3
Вот 5-мерный куб, в котором проведены только ребра, необходимые
для минимальной связи между вершинами.
Так устроено соединение процессоров во многопро-цессорных
компьютерах. Но в них обычно вершин-процессоров больше, типично k=16.
Слайд 6Набор булевых значений
Что такое булевы значения?
Джордж Буль в 1854 году
предложил систему исчисления логических высказываний, введя новый тип логических величин,
принимающих два значения – ИСТИНА и ЛОЖЬ (True и False).
Для этих (булевых) величин были введены своеобразные операции, вполне естественные с точки зрения формальной логики.
Сейчас булевы величины широко используются в программировании.
Мы сейчас рассмотрим булевы величины и операции с ними.
George Boole
Слайд 7Булевы значения и операции
Примеры булевых значений.
“ 3.1415926” - это
ИСТИНА
“ 4.011” - это ЛОЖЬ
“x y+3” -
это может быть ИСТИНОЙ, а может быть ЛОЖЬЮ в зависимости от значений x и y.
Операция отрицание или НЕТ или NOT или (а в языке программирования Си - !) имеет один логический операнд (она одноместная) и вырабатывает противоположное ему значение:
True = False
False = True
( 3.1415926) = False
Слайд 8Операция конъюнкция
Эта операция называется еще логическим И и обозначается AND,
а также или &. У нее два булевских операнда
и результат операции также булевское значение «оба операнда истинны».
Например, (x>3)(x<7) истинно для всех x, больших 3 и меньших 7.
Слайд 9Операция дизъюнкция
Эта операция называется логическим ИЛИ и обозначается OR, а
также или ||. У нее два булевских операнда и
результат операции также булевское значение «хотя бы один из операндов истинен».
Например, (x>3)(x<7) истинно для всех x, больших 3, и для всех, меньших 7.
Слайд 10Операция эквиваленция
Эта операция обозначается EQU, а также . У
нее два булевских операнда и результат операции также булевское значение
«значения операндов совпадают».
Например, (x>3)(x<7) истинно для всех x, больших 3, и меньших 7 (вариант, когда оба операнда ложны, здесь невозможен).
Слайд 11Операция «исключающее ИЛИ»
Эта операция обозначается XOR (от eXclusive OR), она
общепринятого обозначения не имеет, хотя появилось обозначение . У нее
два булевских операнда и результат операции также булевское значение «значения операндов не совпадают».
(x>3) XOR (x<7) истинно для всех x, больших 3, и для всех, меньших 7.
Эта операция имеет удобное свойство
(a XOR b) XOR b = a
которое используется в компьютерной графике.
Слайд 12Операция импликация
Редко используемая операция «следования» обозначается IMP (от IMPlication), или
. У нее два булевских операнда и результат операции также
булевское значение «либо ложен первый операнд, либо истинен второй».
(x>3) IMP (x<7) истинно для всех x, меньших 7.
Слайд 13Таблица логических операций
Все названные двуместные операции можно свести в таблицу
Слайд 140-1 представление булевых значений
Естественна трактовка нуля и единицы как логических
значений, соответственно, False и True.
Все логические операции легко переписать для
этого представления.
Но и 0-1 набор можно представлять как набор логических значений и все перечисленные логические операции выполнять над наборами-операндами покомпонентно.
Слайд 15Пример логических операций над 0-1 наборами
Слайд 16Логические функции
Комбинируя значения отдельных компонент логического набора в более сложных
операциях, можно составлять более сложные функции от логических аргументов.
Функция
от логических значений, принимающая логические значения, называется логической функцией.
Заметим, что каждая логическая функция может быть задана таблицей истинности -перечислением тех наборов аргументов, которым соответствует значение True.
Используя эту таблицу, всегда можно представить логическую функцию в виде дизъюнкции конъюнкций.
Слайд 17ДНФ (дизъюнктивная нормальная форма)
Функция f может быть всегда представлена
так
f(x1,x2,…,xk)=aT (i1:k v(xi,a))
где T – таблица истинности. Каждый входящий в
нее набор a определяет для каждой переменной xi способ ее вхождения в соответствующую a дизъюнкцию: входит сама переменная или ее отрицание. Эта зависимость спрятана в функции v.
Интересна задача сокращения ДНФ до минимума.
Слайд 18Характеристический вектор множества
Если сопоставить элементы конечного множества S мощности k
позициям в наборе из нулей и единиц, то подмножествам можно
сопоставить такие наборы. Пусть для простоты S=1:9. Подмножеству A={1,2,6,7,9} соответствует набор 110001101.
Такой 0-1 набор A называется характеристическим вектором множества .
Операции над множествами легко моделируются логическими операциями над их характеристическими векторами.
Например,
AB = A B
Слайд 19Двоичное представление числа
Вы, конечно, знаете, что каждое натуральное число однозначно
представимо в виде суммы степеней 2, причем каждая степень в
этой сумме появляется не больше одного раза, т. е. с коэффициентом 0 или 1. Эти коэффициенты составляют представление числа в двоичной системе счисления.
Например, 83=64+16+2+1=1010011.
Таким образом, каждый набор из k нулей и единиц соответствует какому-либо числу в диапазоне от 0 до 2k-1.
Слайд 20Степени двойки
Степени двойки из-за использования двоичной системы встречаются так часто,
что некоторые из них полезно помнить наизусть.
Число 2^{10} – это
наша тысяча. Оно обозначается K и называется кило, (ср. килобайт).
2^{20}= 1048576 – это миллион (мега). Дальше следуют гига и тера, найдите их значения сами.
Слайд 21Арифметические действия с двоичными числами
Вы, конечно, знаете, как удобно выполнять
арифметические действия с двоичными числами.
Напомним, начиная с самого простого, с
прибавления единицы.
Как прибавить единицу к числу 10001110100011111 ?
Ответ: двигаясь от конца к началу, заменять единицы на нули, а встретив нуль, заменить его на единицу и остановиться.
В рассматриваемом случае получится 10001110100100000 . Красным выделена изменившаяся часть.
Слайд 22Арифметические действия с двоичными числами-2
Разработано много эффективных схем сложения, вычитания,
умножения и деления двоичных чисел. Мы ими заниматься не будем.
Но
нужно упомянуть об особом случае умножения и деления двоичного числа на степень двойки 2k. Умножение выполняется приписыванием к записи числа k нулей. В компьютере это соответствует сдвигу записи числа на k позиций влево, и существуют машинные команды сдвига.
Мы говорим влево, считая, что число записано в компьютере так, как мы привыкли писать на бумаге – младшие разряды правее левых. В некоторых случаях полезно считать, что запись идет в противоположном направлении. К этому вопросу мы еще вернемся.
А про команды сдвига нужно поговорить еще.
Слайд 23Арифметические действия с двоичными числами-3
Ясно, что сдвиге влево старшие разряды
теряются (а при делении – сдвиг происходит вправо, и теряются
младшие разряды).
Существуют команды циклического сдвига, при которых вытесняемые разряды занимают освобождающиеся места с другого конца записи. Например, циклический сдвиг на три разряда выглядит так
12345678 45678123
Попробуйте написать программу циклического сдвига элементов массива, не использующую большой дополнительной памяти (порядка длины массива).
Слайд 24Более удобные системы счисления
Двоичная система счисления удобна для компьютера, но
неудобна для человека – слишком длинные получаются записи чисел:
010101110001011101011010
Даже длину
такой записи трудно определить!
Компромиссом между интересами человека и машины являются системы счисления с основаниями, близкими к 10, но являющимися степенью двойки – 8 и 16.
Слайд 25Восьмеричная система счисления
В этой системе 8 цифр – 0, 1,
2, 3, 4, 5, 6, 7. Каждому разряду восьмеричной системы
соответствуют 3 разряда двоичной системы, и переход очень прост:
0 – 000 2 – 010 4 – 100 6 – 110
1 – 001 3 – 011 5 – 101 7 – 111
Число с предыдущего слайда в этой системе записывается так:
010 101 110 001 011 101 011 010
2 5 6 1 3 5 3 2
Итак, 25613532.
Восьмеричная запись сейчас используется относительно редко.
Слайд 26Шестнадцатеричная система счисления
В этой системе 16 цифр. Десять обычных –
0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Еще шесть – это буквы A, B, C, D, E, F. Каждому разряду соответствуют 4 разряда двоичной системы:
0 – 0000 4 – 0100 8 – 1000 C – 1100
1 – 0001 5 – 0101 9 – 1001 D – 1101
2 – 0010 6 – 0110 A – 1010 E – 1110
3 – 0011 7 – 0111 B – 1011 F – 1111
Число из примера в этой системе записывается так:
0101 0111 0001 0111 0101 1010
5 7 1 7 5 A
Итак, 57175A.
16-ричная запись используется очень широко. Особенно при обсуждении вопросов памяти компьютера.
Слайд 27Состояние памяти компьютера
Вся память компьютера состоит из мельчайших магнитных элементов,
каждый из которых может находиться в одном из двух состояний.
Одно из них связывается с нулем, а другое с единицей. Машина может «прочесть» состояние магнита, а значит и хранимую им двоичную цифру. Такая цифра называется битом (bit).
Так как этих цифр очень много, то с ними невозможно работать без укрупнения. Первое укрупнение – то объединение битов в восьмерки – байты (byte). Байт – минимальная адресуемая единица памяти. Это значит, что машинная команда, работающая с памятью может добраться только до всего байта целиком или до еще более крупной единицы памяти.
Слайд 28Машинное слово
Пара подряд идущих байтов называется машинным словом (word). Слово
располагается так, чтобы минимальный из адресов байтов был четным (это
называется выравниванием – слово выравнивается на четный адрес).
Один из байтов старший, а другой младший.
Где расположен младший байт? В разных компьютерах по-разному. Если впереди, то говорят, что компьютер мелкоконечный (little endian – этот термин ввел Джонатан Свифт в «Путешествии Гулливера»). Если сзади, то компьютер крупноконечный (bigendian).
Наши персональные компьютеры – мелкоконечные, и когда вы находите в памяти целое число, занимающее два байта, например, 515 = 020316, то в первом байте пишется 03, а во втором – 02.
Слайд 29«Путешествия Гулливера»
Процитируем:
It is computed, that 11 000 persons have, at
several times, suffered death, rather than submit to break their
eggs at the smaller end. Many hundred large volumes have been published upon this controversy: but the books of the Big-Endians have been long forbidden, and the whole party rendered incapable by law of holding employments.
Jonathan Swift,
The Travels of Gulliver
Слайд 30Побайтовое кодирование символов
Важным событием в развитии информатики (Computer Science) и
вычислительной техники было принятие байта в качестве единицы при кодировании
символов. Вначале такие коды были приняты фирмой IBM при разработке знаменитого комплекса IBM-360, а сейчас превратились в общемировой стандарт.
В Советском Союзе внедрение машин Единой Серии (ЕС), клонировавших IBM-360, байты появились «автоматически». Было очень удобно, что в 256=28 кодовых возможностей свободно умещаются и заглавные и строчные буквы и латиницы и кириллицы.
Слайд 31Таблица ASCII
Сейчас самым важным стандартом (их несколько) является ASCII.
Это аббревиатура
для American Standard Code for Information Interchange.
Он стал мировым стандартом
кодировки для практически всех компьютеров. В этом коде на каждый символ приходится по одному байту, причем стандарт фиксирует верхнюю половину таблицы с кодами от 0 до 127.
Представив байт двумя 16-ричными цифрами, мы можем сказать, что это коды от 00 до 7F. Некоторые сведения об этой таблице хорошо запомнить.
Слайд 32Таблица ASCII (продолжение)
Первые две строчки заполнены служебными символами (типа возврата
каретки, перевода строки, табуляции, звонка, конца передачи).
Следующая строка начинается с
20 – кода пробела. Дальше идут различные специальные знаки, которые можно не помнить.
Дальше идет строка цифр: от 30 для 0 до 39 для 9. Остаток заполнен спецзнаками.
Строки 4 и 5 заполнены прописными латинскими буквами: 40 для @ (at «коммерческое», а совсем не собака), 41 для A и т.д. вплоть до 5A для Z.
Строки 6 и 7 аналогично заполнены строчными латинскими буквами. 60 используется для ` (обратного апострофа).
Слайд 34Таблица ASCII (продолжение 3)
Вторая половина таблицы ASCII существует в нескольких
вариантах (они называются codepages – кодовые страницы).
Для нас наиболее
важны следующие страницы
437 – MS DOS Extended
1252 – Windows
866 – DOS Cyrillic
1251 – Win Cyrillic
Слайд 35UNICODE и родственные кодировки
Сейчас идет активный перевод программного обеспечения на
двухбайтовую систему кодировки. Принят международный стандарт, именуемый UNICODE. Этот стандарт
имеет «кодовое пространство» в 216=65536 символов, чего вполне достаточно для всех языков мира, включая полный набор китайских иероглифов (сейчас в китайских компьютерных системах используется сокращенный набор в примерно 5000 знаков).
Для более удобного перехода ASCIIUNICODE разработана специальная кодировка UTF-8 (Unicode Transport Format), о которой речь пойдет в дальнейшем.
Слайд 36Картинка
Двухцветную (скажем, черно-белую) картинку можно свести к некоторому «растру» -
прямоугольной решетке и затем рассматривать как подмножество множества точек этой
решетки. А для задания множества можно построить его характеристический вектор («вытянув» предварительно решетку в линию, т.е. линейно пронумеровав точки решетки).
Например, следуя Малевичу, нарисуем «черный квадрат» 66 на поле 88.
Слайд 37Черный квадрат
Черный квадрат и его
представление в одну
строку. Конечно, вместо
белых
квадратиков нужно
писать нули, а вместо
черных – единицы.
Есть и более
экономные
представления картинок
00000000 01111110 01111110 01111110 01111110 01111110 01111110 00000000
Слайд 38Передача по двоичному каналу связи
В технике связи передачу по каналу
связи очень часто рассматривают как последовательность импульсов, находящихся на двух
уровнях (сигнал и нет сигнала). Таким образом, информация, передаваемая по каналу связи, рассматривается как 0-1 последовательность.
Смысл нулей и единиц в этой последовательности может быть очень разнообразным и хитрым. Некоторые варианты мы в дальнейшем рассмотрим (сжатые тексты и изображения, компьютерные программы, запись звука, шифрограммы).
Но чаще всего – это тексты, о байтовом представлении которых уже говорилось.
Слайд 39Результаты случайных испытаний
В теории вероятностей принято рассматривать случайные последовательности. Для
примера их считают результатами бросания монеты: при падении монета может
упасть на разные стороны, которые традиционно называются Гербом и Решеткой (Решкой). Вот и получается
ГГГРРГРГГРРРРГРГРГГГРГ
- те же нули и единицы.
Слайд 40Путь в целочисленной решетке
0-1 набор иногда полезно представлять путем на
прямоугольной решетке. Вот путь для набора 11011100010011. По разности координат
начала и конца легко судить о числе нулей и единиц в наборе.
Слайд 41Штрихкоды
Нули и единицы, несущие информацию, могут иногда представляться очень своеобразно.
Например, вы уже встречались, вероятно, с полосками на упаковках товаров.
Они называются штрихкодами (barcodes) и предназначены для быстрого считывания информации специальными устройствами.
Сейчас есть очень много вариантов штрихкодов, специально приспособленных для тех или иных ситуаций. Рассмотрим только некоторые из них.
Слайд 42Штрихкоды-1
Ручной сканер считывает штрихкод
с упаковки сока. (фото С.Е.Столяра)
Слайд 43Штрихкоды-2
Почтовые штрихкоды США. Код «2 из 5»,
каждая полоска – один
бит.
Почтовые штрихкоды Великобритании. Каждая
полоска – два бита.
Слайд 44Штрихкоды-3
Перемежающиеся коды. Полоски двух символов
идут через одну (каждый символ
одного цвета).
Бит кодируется шириной полоски. Завершающая
полоска в конце
нужна для определения ширины
последней белой полоски.
1 – 0001
2 - 0010
Слайд 45Представление чисел с плавающей точкой
Числа с плавающей точкой представляются в
компьютере приблизительно. Сейчас широко распространен стандарт IEEE, в котором фиксированы
две формы числа – 32-битовая и 64-битовая.
Рассмотрим первую из них. Число занимает двойное слово, и составляющие его 32 бита b1,…,b32 разбиты на три поля (вот как: 0-1 набор разбивается на поля, и только это разбиение нам сейчас важно):
s = b1 - знак числа
e = b2:9 - порядок числа
f = b10:32 – дробная часть нормализованной мантиссы
Таким образом,
x = (-1)s2e-127 (1.f)
Слайд 46Перебор 0-1 наборов
Сейчас мы ответим на три вопроса:
Сколько элементов в
множестве Bk ?
Как эти элементы перенумеровать ?
Как эти элементы перебрать
?
Ответы на первые два вопроса мы уже дали раньше: |Bk|=2k, и каждый набор можно рассматривать как двоичное представление целого числа, которое и является его номером. Например, #(0101)=5.
Слайд 47Перебор 0-1 наборов - 2
Как же эти элементы перебрать ?
Очень
просто: начать с нулевого набора, которому соответствует число 0, а
далее прибавлять о единице (работая прямо с двоичным набором, мы это уже умеем).
00000 01000 10000 11000
00001 01001 10001 11001
00010 01010 10010 11010
00011 01011 10011 11011
00100 01100 10100 11100
00101 01101 10101 11101
00110 01110 10110 11110
00111 01111 10111 11111
Слайд 48Перебор 0-1 наборов – 3
Однако в некоторых случаях такая форма
перебора неудобна из-за того, что при переходе от одного набора
к другому текущий набор сильно изменяется.
Вопрос: нельзя ли осуществить перебор так, чтобы при каждом переходе изменение было только в одном бите.
Ответ: это возможно.
Мы покажем эту возможность дважды:
Как математики и
Как программисты.
Слайд 49Перебор 0-1 наборов – 4М
Как математики:
0 0 0
0 0 1
0
1 1
0 1 0
1 1 0
1 1 1
1 0 1
1
0 0
В первой колонке запишем в половине строк нули, а дальше единицы. Заполним первую половину наборами длины k-1, а затем зеркально отобразим эти наборы во второй половине. А наборы меньшей длины будем перебирать так же.
Слайд 50Перебор 0-1 наборов – 4П
Как программисты:
Запишем перебор наборов по
возрастанию и с единичными «мутациями»:
0 0 0 0
0 0
0 0 1 0 0 1
0 1 0 0 1 1
0 1 1 0 1 0
1 0 0 1 1 0
1 0 1 1 1 1
1 1 0 1 0 1
1 1 1 1 0 0
Видите? Там, где в правой таблице меняется значение бита, в левой появляется 1. (докажите)
Значит, нужно иметь два рабочих 0-1 набора. В первом моделировать прибавление 1, а во втором, зная позицию изменения, менять значение бита.
Эта последовательность наборов называется кодом Грея.
Слайд 51Дополнительная литература-1
Это действительно классический западный учебник по основным алгоритмам информатики.
Книга дорогая, но очень полезная.
ISBN 5-900916-37-5
Слайд 52Дополнительная литература-2
Книг по комбинаторике очень много, но по программистским вопросам
только одна.
Она была издана издательством «Мир» в 1988 году тиражом
45000 экземпляров, так что иногда встречается.
Слайд 53Экзаменационные вопросы
Логические значения и операции
Логические функции и ДНФ
Характеристический вектор
множества
Кодировка ASCII и ее варианты
UNICODE и UTF-8
Штрихкоды (по книжке)
Перебор двоичных
наборов и код Грея