Разделы презентаций


Снижение размерности пространства. Метод главных компонент (principal

Содержание

Снижение размерности пространства признаковЗачем?наглядно представить исходные данныеупростить исследуемую модельснизить объемы хранимой информацииБез потери информативности!

Слайды и текст этой презентации

Слайд 1 Снижение размерности пространства. Метод главных компонент (principal components analysis, PCA) Примеры практического использования

метода главных компонент для снижения размерности пространства признаков

Снижение размерности пространства. Метод главных компонент (principal components analysis, PCA) Примеры практического использования метода главных

Слайд 2Снижение размерности пространства признаков
Зачем?
наглядно представить исходные данные
упростить исследуемую

модель
снизить объемы хранимой информации
Без потери информативности!

Снижение  размерности  пространства признаковЗачем?наглядно представить исходные данныеупростить исследуемую модельснизить объемы хранимой информацииБез потери информативности!

Слайд 3Легко снизить пространство при:
Дублировании информации (сильно взаимосвязанные показатели) – исключаем

из рассмотрения

Наличии неинформативных переменных (переменных, практически не меняющихся при переходе

от объекта к объекту) – исключаем из рассмотрения

Наличии однотипных переменных - агрегируем (или простое суммирование) однотипные переменные

Легко снизить пространство при:Дублировании информации (сильно взаимосвязанные показатели) – исключаем из рассмотренияНаличии неинформативных переменных (переменных, практически не

Слайд 4Два способа снижения размерности
1 способ (удаляем неинформативные из исходного

перечня данных)
Без видоизменения пространства исходных переменных
(корреляционный анализ)
2 способ (переходим

к новому пространству, каждая переменная в новом пространстве – линейная комбинация исходных переменных)
С преобразованием пространства
(факторный анализ, метод главных компонент (МГК)) – см. 4 задание в практической работе «Очистка данных»
Два способа снижения размерности1 способ  (удаляем неинформативные из исходного перечня данных)Без видоизменения пространства исходных переменных(корреляционный анализ)

Слайд 5Пример снижения размерности
Для оценки коммерческой эффективности инвестиционных проектов используются следующие

показатели:

1) Доход на капитал
2) Срок окупаемости
3) Будущая стоимость проекта
4)

NPV – чистая дисконтированная стоимость
5) IRR – внутренняя норма рентабельности
6) PI – индекс доходности
7) PBP – период возврата вложений

Жизненный цикл инвестиционного проекта (ИП)

Пример снижения размерностиДля оценки коммерческой эффективности инвестиционных проектов используются следующие показатели:1) Доход на капитал2) Срок окупаемости 3)

Слайд 6Смысловая нагрузка показателей
y1 – Доход на капитал - отношение среднегодовой

прибыли от реализации проекта к первоначальным вложениям в проект (max)
y2

– Срок окупаемости проекта - период, требуемый для возврата первоначальных инвестиционных расходов посредством накопленных чистых потоков реальных денег, полученных с помощью проекта (min)
y3 – Будущая стоимость проекта - сумма чистых денежных потоков, связанных с реализацией проекта, за весь период его осуществления (max)
y4 – NPV - сумма текущих чистых денежных потоков за весь расчетный период, приведенная к начальному шагу расчета (max)
y5 – IRR - ставка дисконтирования, при которой NPV (чистая дисконтированная стоимость) за весь срок жизни инвестиционного проекта равна нулю (max)
y6 – PI - отношение суммы дисконтированных чистых денежных потоков проекта к дисконтированной величине инвестиций (max)
y7 – PBP - количество периодов, в течении которых дисконтированная денежная прибыль возмещает дисконтированную сумму капитальных вложений (min)


Смысловая нагрузка показателейy1 – Доход на капитал - отношение среднегодовой прибыли от реализации проекта к первоначальным вложениям

Слайд 71 способ – корреляционный анализ

1 способ – корреляционный анализ

Слайд 81 способ – корреляционный анализ

1 способ – корреляционный анализ

Слайд 91 способ – корреляционный анализ
Наиболее сильно коррелируют:
У2 и У7 (срок

окупаемости и период возврата капитальных вложений);
У3 и У5 (будущая

стоимость проекта и чистая дисконтированная стоимость NPV);
У4 и У6 (внутренняя норма прибыли IRR и индекс прибыльности PI).

Это значит, что можно без ущерба для качества принятия инвестиционного решения исключить из целевой функции три признака. Пусть это будут У2, У3, У6. Таким образом целевая функция вполне может быть описана следующими частными критериями:
1 – доход на капитал – У1;
2 – внутренняя норма прибыли IRR - У4;
3 – чистая дисконтированная стоимость NPV – У5;
4 – период возврата капитальных вложений PBP – У7.
1 способ – корреляционный анализНаиболее сильно коррелируют:У2 и У7 (срок окупаемости и период возврата капитальных вложений); У3

Слайд 10Для углубленного исследования признакового пространства применяется Метод главных компонент –

PCA – это 2 способ снижения размерности

Для углубленного исследования признакового пространства применяется Метод главных компонент – PCA – это 2 способ снижения размерности

Слайд 20Пример практического применения PCA
Для оценки коммерческой эффективности инвестиционных проектов используются

следующие показатели:

1) Доход на капитал
2) Срок окупаемости
3) Будущая стоимость

проекта
4) NPV – чистая дисконтированная стоимость
5) IRR – внутренняя норма рентабельности
6) PI – индекс доходности
7) PBP – период возврата вложений

Жизненный цикл инвестиционного проекта (ИП)

Пример практического применения PCAДля оценки коммерческой эффективности инвестиционных проектов используются следующие показатели:1) Доход на капитал2) Срок окупаемости

Слайд 21Смысловая нагрузка показателей
y1 – Доход на капитал - отношение среднегодовой

прибыли от реализации проекта к первоначальным вложениям в проект (max)
y2

– Срок окупаемости проекта - период, требуемый для возврата первоначальных инвестиционных расходов посредством накопленных чистых потоков реальных денег, полученных с помощью проекта (min)
y3 – Будущая стоимость проекта - сумма чистых денежных потоков, связанных с реализацией проекта, за весь период его осуществления (max)
y4 – NPV - сумма текущих чистых денежных потоков за весь расчетный период, приведенная к начальному шагу расчета (max)
y5 – IRR - ставка дисконтирования, при которой NPV (чистая дисконтированная стоимость) за весь срок жизни инвестиционного проекта равна нулю (max)
y6 – PI - отношение суммы дисконтированных чистых денежных потоков проекта к дисконтированной величине инвестиций (max)
y7 – PBP - количество периодов, в течении которых дисконтированная денежная прибыль возмещает дисконтированную сумму капитальных вложений (min)


Смысловая нагрузка показателейy1 – Доход на капитал - отношение среднегодовой прибыли от реализации проекта к первоначальным вложениям

Слайд 22Исходные данные - 7-мерное пространство

Исходные данные - 7-мерное пространство

Слайд 23Основная идея PCA (на примере)
От исходного 7-мерного пространства (y1,

y2, y3, y4, y5, y6, y7)
переходим к новому пространству -

тоже 7-мерному (P1, P2, P3, P4, P5, P6, P7) – это новая ортогональная 7-мерная система координат.
Каждый показатель в новом пространстве (компонента, фактор) – линейная комбинация всех показателей исходного пространства:

Р1=а11*y1+а12*y2+а13*y3+а14*y4+а15*y5+а16*y6+а17*y7

Р2=а21*y1+а22*y2+а23*y3+а24*y4+а25*y5+а26*y6+а27*y7


Р7=а71*y1+а72*y2+а73*y3+а74*y4+а75*y5+а76*y6+а77*y7


Основная идея PCA (на примере) От исходного 7-мерного пространства (y1, y2, y3, y4, y5, y6, y7)переходим к

Слайд 24Постановка задачи
Необходимо описать набор критериев числом главных компонент m

, обеспечивающих долю дисперсии 0,85 и сформировать интегральный показатель на

основе матрицы весовых коэффициентов, учитывающих тесноту связи между исходными показателями и главными компонентами.


Постановка задачи Необходимо описать набор критериев числом главных компонент m

Слайд 25Вклад каждой компоненты неодинаков
Предполагается, что исходные показатели y1-y7 полностью объясняют

дисперсию результирующих факторов P1-P7.
Понижение размерности получается путем отбрасывания компонент P,

в наименьшей степени объясняющих дисперсию всех исходных значений.

Слева записана полная дисперсия, а справа – доли полной дисперсии, относящиеся к соответствующим главным компонентам. Дисперсия является характеристикой изменчивости случайной величины, ее отклонений от среднего значения. Полный вклад каждого фактора в дисперсию всех исходных признаков определяет ту долю общей дисперсии, которую данная главная компонента объясняет.

Вклад каждой компоненты неодинаковПредполагается, что исходные показатели y1-y7 полностью объясняют дисперсию результирующих факторов P1-P7.Понижение размерности получается путем

Слайд 26Вклад каждой компоненты неодинаков

Вклад каждой компоненты неодинаков

Слайд 27Принцип выбора координатных осей в новом пространстве
В качестве первой главной

компоненты избирают направление, вдоль которого массив данных имеет наибольший разброс.


Выбор каждой главной последующей компоненты происходит так, чтобы разброс данных вдоль нее был максимальным, и чтобы эта главная компонента была ортогональна другим главным компонентам, выбранным прежде.
В результате получаем несколько главных компонент, каждая следующая из которых несет все меньше информации из исходного набора.
Принцип выбора координатных осей  в новом пространствеВ качестве первой главной компоненты избирают направление, вдоль которого массив

Слайд 28В качестве первой главной компоненты нужно выбрать такую координату, чтобы

соответствующая координатная ось была направлена вдоль того направления, вдоль которого

разброс точек самый большой – то есть вдоль длинной оси эллипсоида.
В качестве первой главной компоненты нужно выбрать такую координату, чтобы соответствующая координатная ось была направлена вдоль того

Слайд 29Результаты использования МГК
1 компонента – индекс доходности Р1
Р1=0,858*y1-0,096*y2+0,965*y3+0,915*y4+0,942*y5+0,966*y6-0,011*y7

2 компонента –

индекс возвратности вложенных средств P2
P2 =0,108*y1+0,987*y2-0,108*y3+0,224*y4+0,047*y5+0,005*y6+0,991*y7

Результаты использования МГК1 компонента – индекс доходности Р1Р1=0,858*y1-0,096*y2+0,965*y3+0,915*y4+0,942*y5+0,966*y6-0,011*y72 компонента – индекс возвратности вложенных средств P2P2 =0,108*y1+0,987*y2-0,108*y3+0,224*y4+0,047*y5+0,005*y6+0,991*y7

Слайд 30Результаты использования МГК
1 компонента – индекс доходности Р1
Р1=0,858*y1-0,096*y2+0,965*y3+0,915*y4+0,942*y5+0,966*y6-0,011*y7

2 компонента –

индекс возвратности вложенных средств P2
P2 =0,108*y1+0,987*y2-0,108*y3+0,224*y4+0,047*y5+0,005*y6+0,991*y7

Результаты использования МГК1 компонента – индекс доходности Р1Р1=0,858*y1-0,096*y2+0,965*y3+0,915*y4+0,942*y5+0,966*y6-0,011*y72 компонента – индекс возвратности вложенных средств P2P2 =0,108*y1+0,987*y2-0,108*y3+0,224*y4+0,047*y5+0,005*y6+0,991*y7

Слайд 31Таким образом, исходное 7-мерное пространство y1-y7 может быть сведено к

2-мерному ортогональному пространству главных компонент P1-P2 без существенной потери информативности.

Таким образом, исходное 7-мерное пространство y1-y7 может быть сведено к 2-мерному ортогональному пространству главных компонент P1-P2 без

Слайд 32ИП в пространстве двух главных компонент (фрагмент, 20 проектов)

ИП в пространстве двух главных компонент (фрагмент, 20 проектов)

Слайд 33Выделение зон коммерческой эффективности ИП в пространстве двух главных компонент

Выделение зон коммерческой эффективности ИП в пространстве двух главных компонент

Слайд 34От двух компонент – к одному обобщенному показателю

От двух компонент – к одному обобщенному показателю

Слайд 35Еще пример – применение МГК для классификации банков
Рассматривалась выборка из

600 коммерческих банков, каждый их которых характеризуется следующими признаками:
кредиты физическим

лицам;
кредиты предприятиям и организациям;
вклады физических лиц;
средства предприятий и организаций;
чистая прибыль;
выданные межбанковские кредиты.
В таблицы – весовые коэффициенты исходных признаков по результатам использования МГК:
Еще пример – применение МГК для классификации банковРассматривалась выборка из 600 коммерческих банков, каждый их которых характеризуется

Слайд 36Распределение банков в пространстве двух главных компонент (600 банков)

Распределение банков в пространстве двух главных компонент (600 банков)

Слайд 37Распределение банков в пространстве двух главных компонент (599 банков)

Распределение банков в пространстве двух главных компонент (599 банков)

Слайд 38Распределение банков в пространстве двух главных компонент (596 банков)

Распределение банков в пространстве двух главных компонент (596 банков)

Слайд 39Распределение банков в пространстве двух главных компонент (100 банков)

Распределение банков в пространстве двух главных компонент (100 банков)

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика