Кластеризация Структура экзаменационных билетов

Содержание

1. Кластеризация Структура экзаменационных билетов
2. Структура экзаменационного билетаВ билете 2 задания:1 задание
3. Примеры задания 1На основе индивидуальных данных о
4. Примеры задания 13. С использованием SAS Studio
5. Примеры задания 21. Постройте и исследуйте три
6. Кластерный анализ в SAS/STAT
7. Кластерный анализ в SAS/STAT
8. Результаты
9. Дендрограмма
10. Number of Clusters - количество кластеровClusters Joined
11. ЗаданияВыполнить задания из файла «Сем 13.10_Кластеризация.doc». 2.
12. Скачать презентанцию

Структура экзаменационного билетаВ билете 2 задания:1 задание – предварительный анализ данных (исследование данных, визуальный анализ, фильтрация, выявление мультиколлинеарности, вывод о возможности снижения признакового пространства (корреляционный анализ, МГК (факторный анализ), кластерный анализ)

Главная
Разное
Кластеризация Структура экзаменационных билетов

Слайды и текст этой презентации

Слайд 1Кластеризация Структура экзаменационных билетов

Слайд 2Структура экзаменационного билета
В билете 2 задания:
1 задание – предварительный анализ

данных (исследование данных, визуальный анализ, фильтрация, выявление мультиколлинеарности, вывод о

возможности снижения признакового пространства (корреляционный анализ, МГК (факторный анализ), кластерный анализ) – 20 баллов
2 задание – прогнозирование (построение нескольких (не больше 3) моделей регрессии или классификации и предсказание целевого признака) – 40 баллов

Структура экзаменационного билетаВ билете 2 задания:1 задание – предварительный анализ данных (исследование данных, визуальный анализ, фильтрация, выявление

Слайд 3Примеры задания 1
На основе индивидуальных данных о клиентах банка (файл

“….csv”) проведите оценку основных статистических характеристик набора данных с использованием

SAS Studio. Сформируйте набор данных с информацией о клиентах старше 45 лет с уровнем дохода не менее 2000 у.е. Проведите визуальный анализ полученной в результате фильтрации выборки (не менее 3 диаграмм)
По результатам корреляционного и компонентного/факторного анализа данных о клиентах страховой компании (файл “….csv”) сделайте вывод о возможности снижения размерности признакового пространства. Предложите смысловую интерпретацию главных компонент. Требуемый уровень информативности – не менее 80%

Примеры задания 1На основе индивидуальных данных о клиентах банка (файл “….csv”) проведите оценку основных статистических характеристик набора

Слайд 4Примеры задания 1
3. С использованием SAS Studio проведите кластеризацию объектов

недвижимости из набора данных «...csv» на функциональные группы методом k-средних

для различных вариантов настроек. Интерпретируйте полученные результаты для трех моделей с помощью отчета по кластеризации, сравните полученные результаты, сделайте выводы

Примеры задания 13. С использованием SAS Studio проведите кластеризацию объектов недвижимости из набора данных «...csv» на функциональные

Слайд 5Примеры задания 2
1. Постройте и исследуйте три регрессионные зависимости срока

кредитования от возраста и длительности трудоустройства иностранных клиентов, арендующих жилье

с использованием инструментов отбора признаков SAS/STAT. Проведите сравнительный анализ качества полученных моделей, предложите смысловую интерпретацию результатов и сделайте выводы
2. Для набора данных «...csv» построить бинарную логистическую регрессию с использованием SAS Studio (не менее 3 моделей-кандидатов, используя различные методы отбора переменных в модель и вид модели). Провести сравнение моделей кандидатов, выявить наилучшую по результатам ROC-кривой и значений показателя AUC, сделать выводы.

Примеры задания 21. Постройте и исследуйте три регрессионные зависимости срока кредитования от возраста и длительности трудоустройства иностранных

Слайд 6Кластерный анализ в SAS/STAT

Слайд 7Кластерный анализ в SAS/STAT

Слайд 8Результаты

Слайд 9Дендрограмма

Слайд 10Number of Clusters - количество кластеров
Clusters Joined - имена объединенных

кластеров. (Наблюдения идентифицируются либо по значению идентификатора, либо по CLn,

где n - номер кластера)
Freq - количество наблюдений в новом кластере
Semipartial R-Square - полупериодический квадрат R, представляет собой уменьшение доли дисперсии, приходящейся на объединение двух кластеров.
R-Square - квадратная кратная корреляция R квадрат, которая представляет собой долю дисперсии, учитываемой кластерами
Approximate Expected R-Square - примерное ожидаемое значение квадрата R. Это ожидание аппроксимируется при нулевой гипотезе о том, что данные имеют равномерное распределение вместо формирования отдельных кластеров.
В следующих трех столбцах отображаются значения статистики кубического критерия кластеризации (CCC), псевдо F (PSF) и (PST2). Эта статистика полезна для оценки количества кластеров в данных.
связи для минимального расстояния; пустое значение указывает на отсутствие связи. Связывание означает, что кластеры являются неопределенными и что изменение порядка наблюдений может изменить кластеры.

Number of Clusters - количество кластеровClusters Joined - имена объединенных кластеров. (Наблюдения идентифицируются либо по значению идентификатора,

Слайд 11Задания
Выполнить задания из файла
«Сем 13.10_Кластеризация.doc».
2. Выполнить кластерный анализ

для набора данных из задания 2 с использованием SAS/STAT (задачи

Кластеризация K-средних;
Кластерные наблюдения)

ЗаданияВыполнить задания из файла «Сем 13.10_Кластеризация.doc». 2. Выполнить кластерный анализ для набора данных из задания 2 с

Скачать презентацию

Разделы презентаций

Кластеризация Структура экзаменационных билетов

Содержание

Слайды и текст этой презентации

Слайд 1Кластеризация Структура экзаменационных билетов

Слайд 2Структура экзаменационного билета
В билете 2 задания:
1 задание – предварительный анализ

данных (исследование данных, визуальный анализ, фильтрация, выявление мультиколлинеарности, вывод о

Слайд 3Примеры задания 1
На основе индивидуальных данных о клиентах банка (файл

“….csv”) проведите оценку основных статистических характеристик набора данных с использованием

Слайд 4Примеры задания 1
3. С использованием SAS Studio проведите кластеризацию объектов

недвижимости из набора данных «...csv» на функциональные группы методом k-средних

Слайд 5Примеры задания 2
1. Постройте и исследуйте три регрессионные зависимости срока

кредитования от возраста и длительности трудоустройства иностранных клиентов, арендующих жилье

Слайд 6Кластерный анализ в SAS/STAT

Слайд 7Кластерный анализ в SAS/STAT

Слайд 8Результаты

Слайд 9Дендрограмма

Слайд 10Number of Clusters - количество кластеров
Clusters Joined - имена объединенных

кластеров. (Наблюдения идентифицируются либо по значению идентификатора, либо по CLn,

Слайд 11Задания
Выполнить задания из файла
«Сем 13.10_Кластеризация.doc».
2. Выполнить кластерный анализ

для набора данных из задания 2 с использованием SAS/STAT (задачи

Обратная связь

Что такое TheSlide.ru?

Разделы презентаций

Кластеризация Структура экзаменационных билетов

Содержание

Слайды и текст этой презентации

Слайд 1Кластеризация Структура экзаменационных билетов

Слайд 2Структура экзаменационного билетаВ билете 2 задания:1 задание – предварительный анализ

данных (исследование данных, визуальный анализ, фильтрация, выявление мультиколлинеарности, вывод о

Слайд 3Примеры задания 1На основе индивидуальных данных о клиентах банка (файл

“….csv”) проведите оценку основных статистических характеристик набора данных с использованием

Слайд 4Примеры задания 13. С использованием SAS Studio проведите кластеризацию объектов

недвижимости из набора данных «...csv» на функциональные группы методом k-средних

Слайд 5Примеры задания 21. Постройте и исследуйте три регрессионные зависимости срока

кредитования от возраста и длительности трудоустройства иностранных клиентов, арендующих жилье

Слайд 6Кластерный анализ в SAS/STAT

Слайд 7Кластерный анализ в SAS/STAT

Слайд 8Результаты

Слайд 9Дендрограмма

Слайд 10Number of Clusters - количество кластеровClusters Joined - имена объединенных

кластеров. (Наблюдения идентифицируются либо по значению идентификатора, либо по CLn,

Слайд 11ЗаданияВыполнить задания из файла «Сем 13.10_Кластеризация.doc». 2. Выполнить кластерный анализ

для набора данных из задания 2 с использованием SAS/STAT (задачи

Похожие презентации

Обратная связь

Что такое TheSlide.ru?

Слайд 2Структура экзаменационного билета
В билете 2 задания:
1 задание – предварительный анализ

Слайд 3Примеры задания 1
На основе индивидуальных данных о клиентах банка (файл

Слайд 4Примеры задания 1
3. С использованием SAS Studio проведите кластеризацию объектов

Слайд 5Примеры задания 2
1. Постройте и исследуйте три регрессионные зависимости срока

Слайд 10Number of Clusters - количество кластеров
Clusters Joined - имена объединенных

Слайд 11Задания
Выполнить задания из файла
«Сем 13.10_Кластеризация.doc».
2. Выполнить кластерный анализ