Слайд 1ИНФОРМАЦИЯ И ЕЕ СВОЙСТВА
Доцент кафедры информатики и информационных таможенных технологий
Ю.И.
Сомов
Слайд 2Учебные вопросы
Информация и данные.
Формы адекватности информации. Меры информации. Качество
информации.
Иерархическая система классификации. Фасетная система классификации. Дескрипторная система классификации.
Информационные процессы
Слайд 4ИНФОРМАЦИЯ И ДАННЫЕ
Информация - сведения об объектах и явлениях окружающей
среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о
них степень неопределенности, неполноты знаний.
Слайд 5Что такое признаки?
Что такое данные?
Слайд 6Наряду c информацией в информатике часто употребляется понятие данные.
Данные
могут рассматриваться как признаки или записанные наблюдения, которые по каким-то
причинам не используются, а только хранятся.
Если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.
Слайд 7Пути и процессы, обеспечивающие передачу сообщений от источника информации к
ее потребителю, называются информационными коммуникациями (каналы информации).
Источник информации
Получатель информации
Сигнал -
носитель информации
Слайд 9Для потребителя информации очень важной характеристикой является ее адекватность.
Адекватность информации
- это определенный уровень соответствия создаваемого с помощью полученной информации
образа реальному объекту, процессу, явлению и т.п.
В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности.
От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.
Слайд 11Синтаксическая адекватность отображает формально-структурные характеристики информации и не затрагивает ее
смыслового содержания.
На синтаксическом уровне учитываются тип носителя и способ
представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными.
Слайд 12Семантическая (смысловая) адекватность определяет степень соответствия образа объекта и самого
объекта.
Семантический аспект предполагает учет смыслового содержания информации.
На этом
уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи.
Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.
Слайд 13Прагматическая (потребительская) адекватность отражает отношение информации и ее потребителя, соответствие
информации цели управления, которая на ее основе реализуется.
Прагматический аспект
связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятельности системы.
Слайд 16Синтаксическая мера информации
Эта мера количества информации оперирует с обезличенной информацией,
не выражающей смыслового отношения к объекту.
Объем данных Vд. в сообщении
измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:
в двоичной системе счисления единица измерения - бит (bit - binary digit - двоичный разряд)
Слайд 17Бит — слишком мелкая единица измерения. На практике чаще применяется
более крупная единица — байт, равная восьми битам. Именно восемь
битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).
Широко используются также ещё более крупные производные единицы информации:
• 1 Килобайт (Кбайт) = 1024 байт = 210 байт,
• 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,
• 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.
• 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,
• 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.
Слайд 18Неопределенность состояния системы (энтропия системы)
Количество информации измеряется изменением (уменьшением) неопределенности
состояния системы:
Ib(a)=H(a) – Hb(a),
где Ib(a) – приобретённая информация;
H(a) – мера неосведомлённости о системе (энтропия);
Hb(a) - мера неосведомлённости о системе после получения сообщения b.
Таким образом, количество информации измеряется изменением (уменьшением) неопределенности состояния системы.
Энтропия системы H(a) может рассматриваться как мера недостающей информации.
Слайд 19Семантическая мера информация
Для измерения смыслового содержания информации, т.е. ее количества
на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает
семантические свойства информации со способностью пользователя принимать поступившее сообщение.
Тезаурус - это совокупность сведений, которыми располагает пользователь или система.
Слайд 20В зависимости от соотношений между смысловым содержанием информации S и
тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем
и включаемой им в дальнейшем в свой тезаурус.
Sp 0 - пользователь не воспринимает, не понимает поступающую информацию
Sp - пользователь все знает, но поступающая информация ему не нужна
Слайд 21Относительной мерой количества семантической информации может служить коэффициент содержательности С,
который определяется как отношение количества семантической информации Ic к ее
объему Vд:
Слайд 22Прагматическая мера информации
Ценность информации целесообразно измерять в тех же самых
единицах (или близких к ним), в которых измеряется целевая функция.
В
экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой
Слайд 26Репрезентативность информации связана с правильностью ее отбора и формирования в
целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
правильность концепции,
на базе которой сформулировано исходное понятие;
обоснованность отбора существенных признаков и связей отображаемого явления.
Слайд 28Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации
в сообщении к объему обрабатываемых данных, т.е.
C=Ic/Vд.
Слайд 30Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный
для принятия правильного решения состав (набор показателей).
Понятие полноты информации
связано с ее смысловым содержанием (семантикой) и прагматикой.
Как неполная, т.е. недостаточная для принята правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Слайд 32Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения
и преобразования.
Например, в информационной системе информация преобразовывается к доступной
и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Слайд 34Актуальность информации определяется степенью сохранения ценности информации для управления в
момент ее использования и зависит от динамики изменения ее характеристик
и от интервала времени, прошедшего с момента возникновения данной информации.
Слайд 36Своевременность информации означает ее поступление не позже заранее назначенного момента
времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью
близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п.
Слайд 38Достоверность информации определяется ее свойством отражать реально существующие объекты с
необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е.
вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Слайд 40Устойчивость информации отражает ее способность реагировать на изменения исходных данных
без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена
выбранной методикой ее отбора и формирования.
Слайд 41Что такое и зачем нужна классификация
чего-либо?
Слайд 42ИЕРАРХИЧЕСКАЯ СИСТЕМА КЛАССИФИКАЦИИ
Классификация - cистема распределения объектов (предметов, явлений, процессов,
понятий) по классам в соответствии с определенным признаком.
Система классификации позволяет
сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств.
Слайд 43Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются
либо числовыми данными, например вес, стоимость, год, либо признаками, например
цвет, марка машины, фамилия.
Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Слайд 44Классификатор - систематизированный свод наименований и кодов классификационных группировок.
При классификации
широко используются понятия классификационный признак и значение классификационного признака, которые
позволяют установить сходство или различие объектов.
Признак классификации имеет также синоним основание деления.
Слайд 45Иерархическая система классификации
В иерархической системе классификации каждый объект на
любом уровне должен быть отнесен к одному классу, который характеризуется
конкретным значением выбранного классификационного признака.
Слайд 46Особенности иерархической системы классификации:
простота построения;
использование независимых классификационных признаков в
различных ветвях иерархической структуры. Недостатки иерархической системы классификации;
жесткая структура,
которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Слайд 47Фасетная система классификации
Фасетная система классификации в отличие от иерархической позволяет
выбирать признаки классификации независимо как друг от друга, так и
от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке хотя предпочтительнее их упорядочение.
Слайд 48Достоинства фасетной системы классификации:
• возможность создания большой емкости классификации, т.е. использования
большого числа признаков классификации и их значений для создания группировок;
• возможность простой модификации всей системы классификации без изменения структуры существующих группировок.
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Слайд 49Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2,...,
Фi,..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена
нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета.
Слайд 50Дескрипторная система классификации
Суть дескрипторного метода классификации заключается в следующем:
отбирается совокупность
ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность
однородных объектов;
выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.
Слайд 52Информационные процессы
создавать;
передавать;
воспринимать;
использовать;
запоминать;
принимать;
копировать;
формализовать;
распространять;
преобразовывать;
комбинировать;
обрабатывать;
делить на части;
упрощать;
собирать;
хранить;
искать;
измерять;
разрушать;
и др.
Процессы, связанные с определенными операциями над информацией, называются информационными процессами.