Разделы презентаций


Визуализация данных при анализе и оценке качества социально-экономических систем

Содержание

Цели визуализацииДля определения качества сложной системы необходимо качественное выполнение задач:преобразования данных; визуализации. Цели визуализации:удобное и наглядное сравнение множества показателей за один взгляд.Быстрое понимание особенностей данных является главным преимуществом визуализации в сравнении

Слайды и текст этой презентации

Слайд 1Визуализация данных при анализе и оценке качества социально-экономических систем
Проузи

Давид Кристофер, студент
prowsedavid@yandex.ru
Научн. Рук.
Татьяна Валентиновна Жгун, к. ф.-м. н.,
доцент

кафедры прикладной математики и информатики
Новгородский гос. университет им. Ярослава Мудрого
г. Великий Новгород,

Визуализация данных  при анализе и оценке качества социально-экономических систем Проузи Давид Кристофер, студентprowsedavid@yandex.ruНаучн. Рук.Татьяна Валентиновна Жгун,

Слайд 2Цели визуализации
Для определения качества сложной системы необходимо качественное выполнение задач:
преобразования

данных;
визуализации.
Цели визуализации:
удобное и наглядное сравнение множества показателей за

один взгляд.
Быстрое понимание особенностей данных является главным преимуществом визуализации в сравнении с другими способами представлением информации (в текстовом виде или в виде таблицы).
выявление особенностей методов дальнейшей работы с данными и необходимых преобразований данных.

Цели визуализацииДля определения качества сложной системы необходимо качественное выполнение задач:преобразования данных; визуализации. Цели визуализации:удобное и наглядное сравнение

Слайд 3Задачи преобразования данных
Задача преобразования данных — представление информации в виде,

способствующем наиболее эффективному использованию.
В контексте проблемы вычисления показателя качества систем,

преобразование данных имеет вполне конкретные цели и задачи, а также использует достаточно стабильный набор методов.
Задачи преобразования данныхЗадача преобразования данных — представление информации в виде, способствующем наиболее эффективному использованию.В контексте проблемы вычисления

Слайд 4 Стандартное преобразование данных в задаче вычисления показателя качества системы
Один

из основных методов преобразования данных в задаче вычисления показателя качества

системы - масштабирование (унификация, нормализация) – процедура предобработки входной информации, при которой значения входных переменных приводятся к некоторому заданному диапазону, например к интервалу [0, 1].
Стандартное преобразование данных  в задаче вычисления показателя качества системыОдин из основных методов преобразования данных

Слайд 5Иное преобразование данных в задаче вычисления показателя качества системы
Для некоторых

данных характерно распределение, когда большая часть значений сосредоточена вблизи среднего

значения, но имеется небольшое количество аномально больших значений или аномально малых значений .
При вычислении интегрального показателя качества системы выбросы на верхнем уровне значений показателя нивелируют остальные значения.
Логарифмическая функция преобразования данных позволяет избежать потерь значений, уменьшая (сжимая) большие значения в наборе данных и растягивая меньшие значения.
Иное преобразование данных  в задаче вычисления показателя качества системыДля некоторых данных характерно распределение, когда большая часть

Слайд 6Визуализация с помощью тепловых карт
Тепловые карты – это тип визуализации,

в которой цвет выступает в качестве дополнительного измерения. Исследователи в

разных областях используют тепловые карты, чтобы представить многомерные данные.
Например, метод тепловых карт широко используется для визуализации данных в генетике и медицине.
Визуализация  с помощью тепловых картТепловые карты – это тип визуализации, в которой цвет выступает в качестве

Слайд 7Рис. 1. Тепловая карта о заболеваемости гепатитом во всех штатах

США. Источник: [http://graphics.wsj.com/infectious-diseases-and-vaccines/]
Пример использования тепловых карт в медицине

Рис. 1. Тепловая карта о заболеваемости гепатитом во всех штатах США.  Источник: [http://graphics.wsj.com/infectious-diseases-and-vaccines/] Пример использования тепловых

Слайд 8Применение тепловых карт при визуализации изменения качества системы
Целью исследования является

обоснование эффективности использования тепловых карт для анализа и оценки качества

социально-экономических систем на примере исследования качества жизни населения РФ.
Визуализация с помощью тепловых карт служит для наглядного сравнения множества показателей при оценке изменения качества жизни и выявления особенностей данных, требующих нестандартных методов дальнейшей работы с данными и необходимых преобразований данных.
Рассматриваются значения 37 переменных, характеризующих качество жизни населения для 83 субъектов РA за 2010-2017гг.
Показатели, определяющие качество жизни, взяты из исследования [1].
Источник данных: Росстат (https://www.gks.ru/).

Применение тепловых карт при визуализации изменения качества системыЦелью исследования является обоснование эффективности использования тепловых карт для анализа

Слайд 9Таблица 1. Переменные Блока 1: Уровень благосостояния населения

Таблица 1. Переменные Блока 1: Уровень благосостояния населения

Слайд 10Таблица 2. Переменные Блока 2: Качество населения

Таблица 2. Переменные Блока 2: Качество населения

Слайд 11Таблица 3. Переменные Блока 3: Качество социальной сферы

Таблица 3. Переменные Блока 3: Качество социальной сферы

Слайд 12На следующем слайде (Рис. 3) представлена тепловая карта переменных, характеризующих

качество жизни для субъектов РФ по годам для 2010 и

2017 годов.
Наилучшему значению показателя соответствует более светлый тон.
Наблюдается посветление общего тона картины , что соответствует общему улучшению ситуации

Рис. 2. Температура тепловой карты

выше

ниже

На следующем слайде (Рис. 3) представлена тепловая карта переменных, характеризующих качество жизни для субъектов РФ по годам

Слайд 13Рис. 3.

Рис. 3.

Слайд 14Рис. 4. Наличие ошибок данных для показателя 36.
Выброс для Тывы

– 2010 год, для Астраханской области – 2010 и 2013

годы (очень темные значения).
Данные для 2011 - 2012 гг сильно отличаются от данных других лет (светлая полоса).

Тепловая карта иллюстрирует наличие ошибок в данных. Для обработки данных нужны методы, учитывающие наличие ошибок.
Рис. 4. Наличие ошибок данных для показателя 36.Выброс для Тывы – 2010 год, для Астраханской области –

Слайд 15Среди данных, характеризующих качества жизни населения РФ, имеются данные с

большим разбросом. На представленных тепловых картах они выражены либо аномально

темным либо аномально светлыми столбцами. Большой разброс данных имеют переменные переменные 1, 8, 9, 22. Для этих переменных необходима логарифмическая коррекция.
Пример данных, для которых нет необходимости логарифмической коррекции и данных, для которых необходима логарифмическая коррекция, приведен на Рис. 5.


Среди данных, характеризующих качества жизни населения РФ, имеются данные с большим разбросом. На представленных тепловых картах они

Слайд 16Рис. 5. Для показателя 21 (левое изображение) нет необходимости лог.

коррекции, для показателя 22 (правое изображение) – необходима лог. коррекция.

Рис. 5. Для показателя 21 (левое изображение)  нет необходимости лог. коррекции, для показателя 22 (правое изображение)

Слайд 17Рис. 6. Изменение переменной 8 за 2010-2017 гг
до (левое

изображение) и после (правое изображение) лог. коррекции.

Рис. 6. Изменение переменной 8 за 2010-2017 гг до (левое изображение) и после (правое изображение)

Слайд 18Рис. 7.
Изменение переменной 9 и за 2010-2017 гг до

(левое изображение) и после (правое изображение) логарифмической коррекции.

Рис. 7. Изменение переменной 9 и за 2010-2017 гг  до  (левое изображение)  и после

Слайд 19Учитывая выявленные особенности данных (наличие ошибок и наличие данных с

большим разбросом), вычислим интегральный индикатор качества жизни населения субъектов РФ

за 2010-2017 гг.

Используем те же данные (слайд 10-12)

Используем алгоритм, вычисления интегрального показателя качества системы, учитывающий наличие ошибок во входных данных, изложенный в [2-6].

Учитывая выявленные особенности данных (наличие ошибок и наличие данных с большим разбросом), вычислим интегральный индикатор качества жизни

Слайд 20Постановка задачи вычисления интегрального показателя качества жизни

Постановка задачи вычисления интегрального показателя качества жизни

Слайд 23Требуется дать мотивированную оценку каждого наблюдаемого объекта на всем промежутке

наблюдений, т.е. определить в динамике интегральную характеристику качества системы.
Для этого

требуется найти веса показателей для каждого момента времени.
В отличие от общепринятых подходов, когда веса отражают важность или значимость переменных, будем считать, что веса должны адекватно отражать свойства рассматриваемой системы.
Т.е. определяемые весовые коэффициенты должны отражать структуру оцениваемой системы.

Требуется дать мотивированную оценку каждого наблюдаемого объекта на всем промежутке наблюдений, т.е. определить в динамике интегральную характеристику

Слайд 24Одним из наиболее простых методов анализа структуры исследуемой системы является

метод главных компонент (PCA). Пространство главных компонент оптимально для моделирования

внутренней структуры данных. Однако классический метод главных компонент терпит неудачу даже при наличии единичных выбросов.

Рис. 8. Чувствительность к повреждениям / выбросам метода главных компонент (PCA)

Одним из наиболее простых методов анализа структуры исследуемой системы является метод главных компонент (PCA). Пространство главных компонент

Слайд 25При построении композитного индекса изменения качества системы весовые коэффициенты (1)

и (2) строятся по статистическим измерениям для ряда наблюдений. Изменение

данных во времени вызывается как изменением ситуации, так и случайными ошибками.


Учитывая неизбежное наличие ошибок в данных, структура системы должна определяться на основании нескольких наблюдений. Главные компоненты будут являть сигналом, который нужно выделить по набору зашумлённых данных. Автором предложена модификация методы главных компонент, которая решает эту проблему [сноска ].

При построении композитного индекса изменения качества системы весовые коэффициенты (1) и (2) строятся по статистическим измерениям для

Слайд 26В качестве оценки достоверности получаемого результата (достоверности вычисляемой интегральной характеристики)

могут выступать, в частности, знаки полученных весовых коэффициентов. Знак должен

иметь однозначную трактовку. Получение отрицательных весовых коэффициентов является главным препятствием для широко использования PCA для построения комплексных индексов.

Если при унификации использовали очевидный характер зависимости переменной с измеряемым показателем качества системы, то знаки весов должны быть однозначно определены и знаки весов при такой унификации должны быть исключительно положительными.  

В качестве оценки достоверности получаемого результата (достоверности вычисляемой интегральной характеристики) могут выступать, в частности, знаки полученных весовых

Слайд 27Таблицы 4. Влияние логарифмической унификации на достоверность выделяемого сигнала Блока

2
При отсутствии логарифмической коррекции веса переменных 19 и 23 отрицательны

и результат нельзя назвать достоверным, так как в этом случае качество жизни увеличивается при увеличении числа инвалидов и при уменьшении образованных людей.
Таблицы 4. Влияние логарифмической унификации на достоверность выделяемого сигнала Блока 2При отсутствии логарифмической коррекции веса переменных 19

Слайд 28Таблица 5. Влияние логарифмической унификации на достоверность выделяемого сигнала. Веса

переменных Блока 1

Таблица 5. Влияние логарифмической унификации на достоверность выделяемого сигнала. Веса переменных Блока 1

Слайд 29Не всегда можно однозначно требовать положительности весового коэффициента. Например, коэффициент

миграции, уровень безработицы не имеют монотонной зависимости с измеряемым качеством

системы. Если весовые коэффициенты таких переменных окажутся отрицательными, это значит, что параметры унификации выбраны неверно, и для улучшения качества системы процессы должны идти в направлениях, противоположных имеющимся.
В табл. 5 отрицательность весового показателя 4 - неравенства доходов не устраняется случае логарифмической коррекции.
Параметр является составным. Желаемое уменьшение этого параметра достигается либо уменьшением числителя (совокупного богатства самых богатых), либо увеличением знаменателя (совокупного богатства самых бедных). Скорости изменения этих величин различны. Отрицательный знак весового коэффициента показывает, что скорости этих процессов для улучшения качества системы должны быть противоположны наблюдаемым.
Не всегда можно однозначно требовать положительности весового коэффициента. Например, коэффициент миграции, уровень безработицы не имеют монотонной зависимости

Слайд 30Переменные третьего блока не требовали логарифмической корректировки. Полученные веса переменных

приведены в таблице 6.

Таблица 6. Веса переменных Блока 3

Переменные третьего блока не требовали логарифмической корректировки. Полученные веса переменных приведены в таблице 6.Таблица 6. Веса переменных

Слайд 31Рис. 9 Значения интегрального показателя качества жизни населения некоторых субъектов

РФ после логарифмической коррекции (слева). Значения комплексных индексов варьируются от

1 до 100. В 2010 г республика Тыва имеет минимальное значение показателя – один, Москва имеет максимальное значение 100.

Рис. 9 Значения интегрального показателя качества жизни населения некоторых субъектов РФ после логарифмической коррекции (слева). Значения комплексных

Слайд 32Список литературы
Исакин М.А. Модификация метода k -средних с неизвестным числом

классов // Прикладная эконометрика. 2006. Выпуск № 4. С. 62–70.
Жгун Т.В.

Алгоритм построения интегрального индикатора качества сложной системы для ряда последовательных наблюдений // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017. Т. 6, № 1. С. 5-25.
Zhgun T.V. Building an integral measure of the quality of life of constituent entities of the Russian Federation using the principal component analysis. Economic and Social Changes: Facts, Trends, Forecast, 2017, issue 10, no. 2, pp. 214-235. DOI: 10.15838/esc/2017.2.50.12
T V Zhgun Complex index of a system’s quality for a set of observations MMPAM’2019 IOP Conf. Series: Journal of Physics: Conf. Series 1352 (2019) 012064 IOP Publishing doi:10.1088/1742-6596/1352/1/012064
Tatyana V. Zhgun Constructing a stable complex index of a system’s quality for a series of observations National Accounting Review 2019, 1(1): 42-61 doi: 10.3934/NAR.2019.1.42
T V Zhgun Complex index of a system's quality for a set of observations Journal of Physics: Conference Series https://doi.org/10.1088/1742-6596/1352/1/012064
 
Список литературыИсакин М.А. Модификация метода k -средних с неизвестным числом классов // Прикладная эконометрика. 2006. Выпуск №

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика