Разделы презентаций


Нейронные сети. Лекция 2

Содержание

Базовая искусственная модельНейронную сеть можно представить себе в виде черного ящика, у которого имеется n входов и m выходов. Кроме этого, имеется набор (матрица) весовых коэффициентов, общее количество которых равно произведению

Слайды и текст этой презентации

Слайд 1Нейронные сети. Лекция 2
базовая искусственная модель;
применение нейронных сетей;

процесс обучения нейронной сети;
алгоритмы обучения нейронной сети;
сбор данных

для нейронной сети;
пре/пост процессирование;
линейная сеть;
многослойный персептрон;
радиальная базисная функция;
сеть Кохонена;
*примеры.
Нейронные сети. Лекция 2 базовая искусственная модель; применение нейронных сетей; процесс обучения нейронной сети; алгоритмы обучения нейронной

Слайд 2Базовая искусственная модель
Нейронную сеть можно представить себе в виде черного

ящика, у которого имеется n входов и m выходов. Кроме

этого, имеется набор (матрица) весовых коэффициентов, общее количество которых равно произведению n на m.

Элементы, обозначенные цифрами от 1 до m представляют собой слой нейронов. Первый слой сети, на который подаются входные сигналы X1…Xn, играет роль распределительного слоя

нейронной сети имеет связи со всем нейронами следующего слоя, называемого обрабатывающим слоем.

Ключевой вопрос – наличие обратной связи. Простейшая сеть имеет структуру прямой передачи сигнала: Сигналы проходят от входов через скрытые элементы и в конце концов приходят на выходные элементы. Такая структура имеет устойчивое поведение. Если же сеть рекуррентная (т.е. содержит связи, ведущие назад от более дальних к более ближним нейронам), то она может быть неустойчива и иметь очень сложную динамику поведения.

Базовая искусственная модельНейронную сеть можно представить себе в виде черного ящика, у которого имеется n входов и

Слайд 3Базовая искусственная модель
Алгоритм
получить входные значения;
вычислить значение активации (взвешенная сумма входа

– пороговое значение);
преобразовать значение активации с помощью функции активации;

Базовая искусственная модельАлгоритмполучить входные значения;вычислить значение активации (взвешенная сумма входа – пороговое значение);преобразовать значение активации с помощью

Слайд 4Применение нейронных сетей
Примеры задач, решаемых с помощью нейронных сетей
Прогнозирование на

фондовом рынке. Зная цены акций за последнюю неделю и сегодняшнее

значение индекса FTSE, спрогнозировать завтрашнюю цену акций.
Предоставление кредита. Требуется определить, высок ли риск предоставления кредита частному лицу, обратившемуся с такой просьбой. В результате разговора с ним известен его доход, предыдущая кредитная история и т.д.
Управление. Нужно определить что должен делать робот (повернуться направо или налево, двигаться вперед и т.д.), чтобы достичь цели; известно изображение, которое передает установленная на роботе видеокамера.

Особенности применения нейронных сетей для решения задач
Сеть можно применять в ситуации, когда у Вас имеется определенная известная информация, и Вы хотите из нее получить некоторую пока неизвестную информацию;
Вы должны знать (или хотя бы иметь серьезные подозрения), что между известными входными значениями и неизвестными выходами имеется связь.

Применение нейронных сетейПримеры задач, решаемых с помощью нейронных сетейПрогнозирование на фондовом рынке. Зная цены акций за последнюю

Слайд 5Процесс обучения нейронной сети

Процесс обучения нейронной сети

Слайд 6Алгоритмы обучения нейронной сети
Обучение с учителем
Подготавливается набор обучающих данных. Эти

данные представляют собой примеры входных данных и соответствующих им выходов.

Сеть учится устанавливать связь между первыми и вторыми;
Нейронная сеть обучается с помощью того или иного алгоритма управляемого обучения, при котором имеющиеся данные используются для корректировки весов и пороговых значений сети таким образом, чтобы минимизировать ошибку прогноза на обучающем множестве.

Обучение без учителя
Обучающие данные содержат только значения входных переменных.
Алгоритмы обучения нейронной сетиОбучение с учителемПодготавливается набор обучающих данных. Эти данные представляют собой примеры входных данных и

Слайд 7Сбор данных для нейронной сети
Причины, ухудшающие качество обучающего множества:
Нерепрезентативность данных;
Будущее

не похоже на прошлое;
Следует учесть все возможности;
Сеть обучается тому, чему

проще всего обучиться;
Несбалансированный набор данных.
Сбор данных для нейронной сетиПричины, ухудшающие качество обучающего множества:Нерепрезентативность данных;Будущее не похоже на прошлое;Следует учесть все возможности;Сеть

Слайд 8Сбор данных для нейронной сети
Основные вопросы:
Какие свойства и признаки объекта

исследования брать в качестве входных значений?
Проводить ли перевод из одной

шкалы в другую?
Проводить ли нормировку значений?
Сколько наблюдений необходимо иметь для обучения сети?
Что делать с не вполне достоверными данными (шумы, аномалии, пропуски)?

Сбор данных для нейронной сетиОсновные вопросы:Какие свойства и признаки объекта исследования брать в качестве входных значений?Проводить ли

Слайд 9Сбор данных для нейронной сети
Выводы:
Выбирайте такие переменные, которые, как Вы

предполагаете, влияют на результат;
С числовыми и номинальными переменными можно работать

непосредственно*. Переменные других типов следует преобразовать в указанные типы или объявить незначащими;
Чем больше в задаче переменных, тем больше нужно иметь наблюдений;
В случае необходимости можно работать с наблюдениями, содержащими пропущенные значения. Если возможно, удалите выбросы. Если данных достаточное количество, уберите из рассмотрения наблюдения с пропущенными значениями.
Сбор данных для нейронной сетиВыводы:Выбирайте такие переменные, которые, как Вы предполагаете, влияют на результат;С числовыми и номинальными

Слайд 10Пре/пост процессирование
Передаточная функция для каждого элемента сети обычно выбирается таким

образом, чтобы ее входной аргумент мог принимать произвольные значения, а

выходные значения лежали бы в строго ограниченном диапазоне ("сплющивание"). При этом, возникает эффект насыщения, когда элемент оказывается чувствительным

лишь к входным значениям, лежащим в некоторой ограниченной области. На рисунке выходное значение всегда будет лежать в интервале (0,1), а область чувствительности для входов чуть шире интервала (-1,+1). Данная функция является гладкой, а ее производная легко вычисляется - это обстоятельство весьма существенно для работы алгоритма обучения сети.
Коль скоро выходные значения всегда принадлежат некоторой ограниченной области, а вся информация должна быть представлена в числовом виде, очевидно, что при решении реальных задач методами нейронных сетей требуются этапы предварительной обработки - пре-процессирования - и заключительной обработки - пост-процессирования данных.

Пре/пост процессированиеПередаточная функция для каждого элемента сети обычно выбирается таким образом, чтобы ее входной аргумент мог принимать

Слайд 11Пре/пост процессирование
Шкалирование
Числовые значения должны быть приведены в масштаб, подходящий для

сети. Обычно исходные данные масштабируются по линейной шкале*.

Номинальные переменные
Номинальная переменная

числовая переменная (Пол = {Муж, Жен} Муж = 0, Жен = 1)
Кодирование 1-из-N: (Животное = {Собака, Овца, Кошка} Собака = {1,0,0}, Овца = {0,1,0}, Кошка = {0,0,1})
Пре/пост процессированиеШкалированиеЧисловые значения должны быть приведены в масштаб, подходящий для сети. Обычно исходные данные масштабируются по линейной

Слайд 12Линейная сеть
Линейная модель сети – это сеть без промежуточных слоев,

которая в выходном слое содержит только линейные элементы.

Во время

работы сеть фактически умножает вектор входов на матрицу весов, а затем к полученному вектору прибавляет вектор смещения (вектор пороговых значений).

Линейная сеть является хорошей точкой отсчета для оценки качества построенных Вами нейронных сетей. Может оказаться так, что задачу, считавшуюся очень сложной, можно успешно не только нейронной сетью, но и простым линейным методом. Если же в задаче не так много обучающих данных, то, вероятно, просто нет оснований использовать более сложные модели.

СМЕНИТЬ

Линейная сетьЛинейная модель сети – это сеть без промежуточных слоев, которая в выходном слое содержит только линейные

Слайд 13Многослойных персептрон
Обучение многослойного персептрона
Целью обучения является поиск таких значений весов

и порогов сети, которые бы минимизировали ошибку прогноза, выдаваемого сетью.

Функции

ошибок:
сумма квадратов ошибок;
среднеквадратическая ошибка.

Поверхности ошибок:
параболоид;
сложная форма (с множеством глобальных минимумов).
Многослойных персептронОбучение многослойного персептронаЦелью обучения является поиск таких значений весов и порогов сети, которые бы минимизировали ошибку

Слайд 14Многослойный персептрон
Алгоритм обратного распространения
вектор градиента указывает направление кратчайшего спуска;

величина шага берется пропорциональна «крутизне склона»;
в алгоритм вводится слагаемое

импульса (или инерции).

Проблемы, возникающие при обучении:
переобучение;
обобщение;
нерепрезентативный набор данных.

Многослойный персептронАлгоритм обратного распространения вектор градиента указывает направление кратчайшего спуска; величина шага берется пропорциональна «крутизне склона»; в

Слайд 15Радиальная базисная функция
Используется для разбиения пространства входных данных окружностями или

(в общем случае) гиперсферами.
Отличия сетей RBF от сетей MLP:
моделируют

произвольную нелинейную функцию с помощью всего одного промежуточного слоя;
сети с RBF обучается на порядок быстрее MLP;
«групповое» представление пространства модели (в отличие от «плоскостного»);
при удалении от обучающего множества значение функции отклика быстро спадает до нуля;
сети с RBF более чувствительны к «проклятию размерности»
сети с RBF испытывают трудности, когда число входов велико.
Радиальная базисная функцияИспользуется для разбиения пространства входных данных окружностями или (в общем случае) гиперсферами.Отличия сетей RBF от

Слайд 16Радиальная базисная функция
Обучение RBF-сети проходит в несколько этапов:
Определяются центры и

отклонения для радиальных элементов;
Оптимизируются параметры линейного выходного слоя.
Расположение центров должно

соответствовать кластерам, реально присутствующим в исходных данных. Рассмотрим два наиболее часто используемых метода:
выборка из выборки;
алгоритм К-средних.

После того, как определено расположение центров, нужно найти отклонения. Величина отклонения определяет «остроту» гауссовой функции. Используют несколько методов:
явный;
изотропный;
К ближайших соседей.
Радиальная базисная функцияОбучение RBF-сети проходит в несколько этапов:Определяются центры и отклонения для радиальных элементов;Оптимизируются параметры линейного выходного

Слайд 17Сеть Кохонена
Сеть рассчитана на неуправляемое обучение.

Возможности применения:
Распознавать кластеры в данных;
Устанавливать

близость классов;
Выявлять новизну данных.

В результате итеративной процедуры обучения сеть организуется

таким образом, что элементы, соответствующие центрам, расположенным близко друг от друга в пространстве входов, будут располагаться близко друг от друга и на топологической карте. Топологический слой сети можно представлять себе как двумерную решетку, которую нужно так отобразить в N-мерное пространство входов, чтобы по возможности сохранить исходную структуру данных.
Сеть КохоненаСеть рассчитана на неуправляемое обучение.Возможности применения:Распознавать кластеры в данных;Устанавливать близость классов;Выявлять новизну данных.В результате итеративной процедуры

Слайд 18Сеть Кохонена
На каждой эпохе алгоритм обрабатывает каждый из обучающих примеров,

и затем применяет следующий алгоритм:
выбрать выигравший нейрон (то

есть тот, который расположен ближе всего к входному примеру);
скорректировать выигравший нейрон так, чтобы он стал более похож на этот входной пример (взяв взвешенную сумму прежнего центра нейрона и обучающего примера).

После того, как сеть обучена распознаванию структуры данных, ее можно использовать как средство визуализации при анализе данных, при котором можно определить разбивается ли карта на отдельные кластеры.
Далее, как только кластеры выявлены, нейроны топологической карты помечаются содержательными по смыслу метками (в некоторых случаях помечены могут быть и отдельные наблюдения).

Сеть КохоненаНа каждой эпохе алгоритм обрабатывает каждый из обучающих примеров, и затем применяет следующий алгоритм:  выбрать

Слайд 19Пример работы сети Кохонена
Задача:
Имеется множество данных, в которых содержатся атрибуты

«Возраст» и «Доход», которые были предварительно нормализованы

Пример работы сети КохоненаЗадача:Имеется множество данных, в которых содержатся атрибуты «Возраст» и «Доход», которые были предварительно нормализованы

Слайд 20Пример работы персептрона Розенблата
Применяется для распознавания образов и состоит из

трех слоев
Слой S1…Sn - входной сенсорный слой. Служит для принятия сигналов.
Слой

A1…Am - ассоциативный слой. Служит для обработки информации.
Слой R1…Rm – эффекторный слой. Служит для передачи выходных воздействий. Особенностью этого слоя является использование в нейронах пороговой функции активации.
Пример работы персептрона РозенблатаПрименяется для распознавания образов и состоит из трех слоевСлой S1…Sn - входной сенсорный слой. Служит

Слайд 21Пример реализации нейронных сетей в Matlab

Пример реализации нейронных сетей в Matlab

Слайд 22Пример системы распознавания образов

Пример системы распознавания образов

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика