Разделы презентаций


Отбор признаков Снижение размерности признакового пространства методом главных

Содержание

Основные приложенияDimensionality reduction Снижение размерности данных при сохранении всей или большей части информацииFeature extraction Выявление и интерпретация скрытых признаков

Слайды и текст этой презентации

Слайд 1Отбор признаков Снижение размерности признакового пространства методом главных компонент

Отбор признаков  Снижение размерности признакового пространства методом главных компонент

Слайд 2Основные приложения
Dimensionality reduction Снижение размерности данных при сохранении всей или большей

части информации
Feature extraction Выявление и интерпретация скрытых признаков

Основные приложенияDimensionality reduction Снижение размерности данных при сохранении всей или большей части информацииFeature extraction Выявление и интерпретация

Слайд 3Анализ заемщиков банка
Задача : Проанализировать заемщиков банка на основе различных

данных

Анализ заемщиков банкаЗадача : Проанализировать заемщиков банка на основе различных данных

Слайд 4Личные данные
Семейное положение
Образование
Финансовое состояние
Имущество
Кредитная история

Данные могут быть:

Личные данныеСемейное положениеОбразованиеФинансовое состояниеИмуществоКредитная история…  Данные могут быть:

Слайд 5Пример: Give Me Some Credit*
* https://www.kaggle.com/c/GiveMeSomeCredit

Пример: Give Me Some Credit** https://www.kaggle.com/c/GiveMeSomeCredit

Слайд 6Признаки
Возобновляемое использование необеспеченных линий
Возраст
Количество просроченных дней 30-59
Коэффициент задолженности
Ежемесячный доход
Количество

открытых кредитных линий и займов
Количество просрочек на 90 дней позже
Количество

кредитов на недвижимость или линии
Количество просроченных дней 60-89
Количество иждивенцев

ПризнакиВозобновляемое использование необеспеченных линийВозрастКоличество просроченных дней 30-59 Коэффициент задолженностиЕжемесячный доходКоличество открытых кредитных линий и займовКоличество просрочек на

Слайд 7Пример: Give Me Some Credit*
* https://www.kaggle.com/c/GiveMeSomeCredit

Пример: Give Me Some Credit** https://www.kaggle.com/c/GiveMeSomeCredit

Слайд 8Задача снижения размерности
Представить набор данных меньшим числом признаков таким образом,

чтобы потеря информации, содержащейся в оригинальных данных, была минимальной.

Задача снижения размерностиПредставить набор данных меньшим числом признаков таким образом, чтобы потеря информации, содержащейся в оригинальных данных,

Слайд 9Principal Component Analysis (PCA)
Данные заданы матрицей

размерности n×m, где

и , n – число наблюдений (объектов), m – число признаков.

Principal Component Analysis (PCA)Данные заданы матрицей         размерности n×m,

Слайд 10PCA в SAS Studio

PCA в SAS Studio

Слайд 11PCA в SAS Studio

PCA в SAS Studio

Слайд 12Principal Component Analysis
Обозначим за C (m×m) матрицу ковариаций признаков матрицы

X:



В матричном виде:

Principal Component AnalysisОбозначим за C (m×m) матрицу ковариаций признаков матрицы X:В матричном виде:

Слайд 13Principal Component Analysis
Вариация i-го признака:
Общая вариация данных:

Задача: найти ортогональные векторы такие, что

т.е. проекция данных на которые позволит сохранить наибольшую вариацию
Principal Component Analysis Вариация i-го признака: Общая вариация данных: Задача: найти ортогональные векторы   такие, что

Слайд 14Матрица C симметричная и положительно определена. Имеет место равенство:





Principal Component

Analysis

Матрица C симметричная и положительно определена. Имеет место равенство:Principal Component Analysis

Слайд 15Principal Component Analysis
Главные компоненты:


Доля объясненной вариации:

Principal Component Analysis Главные компоненты: Доля объясненной вариации:

Слайд 16Доля объясненной вариации

Доля объясненной вариации

Слайд 17Доля объясненной вариации

Доля объясненной вариации

Слайд 18Интерпретация главных факторов

Интерпретация главных факторов

Слайд 19Интерпретация главных факторов
Исходя из структуры матрицы факторных нагрузок, можно предложить

следующую интерпретацию:
U1: История просроченных выплат по кредитам
U2: Имеющиеся кредиты
U3: Показатель

независимости
U4: Задолженности
U5: Показатель расточительности
U6: Доход


Интерпретация главных факторовИсходя из структуры матрицы факторных нагрузок, можно предложить следующую интерпретацию:U1: История просроченных выплат по кредитамU2:

Слайд 20Интерпретация главных факторов

Интерпретация главных факторов

Слайд 21Singular value decomposition
Данные заданы матрицей

размерности n×m, где

и , n – число наблюдений (объектов), m – число признаков.

Требуется среди всех матриц такого же размера n×m и ранга ≤ k найти матрицу Y, для которой норма матрицы будет минимальной.
Singular value decompositionДанные заданы матрицей         размерности n×m,  где

Слайд 22Выбор числа k главных факторов
Общая дисперсия данных:


Доля объясненной дисперсии:



Хорошим значением

считается доля объясненной дисперсии ≥ 80%

Выбор числа k главных факторовОбщая дисперсия данных:Доля объясненной дисперсии:Хорошим значением считается доля объясненной дисперсии ≥ 80%

Слайд 23Задания
Воспроизведите программный код, представленный в файле Сем 3_PCA.doc
Воспроизведите

вычисления, представленные в лекционных материалах для набора данных из файла

‘cs-training.csv’. Выполните анализ методом главных компонент, выделите главные факторы, объясняющие не менее 80% дисперсии исходных признаков (или покажите, что этого сделать нельзя), предложите смысловую интерпретацию выделенных главных компонент.
Задания Воспроизведите программный код, представленный в файле Сем 3_PCA.doc Воспроизведите вычисления, представленные в лекционных материалах для набора

Слайд 24PCA в SAS Studio (задание 1)

PCA в SAS Studio (задание 1)

Слайд 25PCA в SAS Studio

PCA в SAS Studio

Слайд 26PCA в SAS Studio

PCA в SAS Studio

Слайд 27PCA в SAS Studio

PCA в SAS Studio

Слайд 28PCA в SAS Studio
Матрица факторных нагрузок

PCA в SAS StudioМатрица факторных нагрузок

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика