Слайд 1Нейронные сети
Полежаев Илья
StatSoft® Russia
Слайд 6Современная биология:
Клетка - элементарный процессор, способный к простейшей обработке информации
Нейрон
- элемент клеточной структуры мозга
Нейрон осуществляет прием и передачу информации
в виде импульсов нервной активности
Природа импульсов - электрохимическая
Слайд 8Интересные данные
Тело клетки имеет размер 3 - 100 микрон
Гигантский аксон
кальмара имеет толщину 1 миллиметр и длину несколько метров
Потенциал, превышающий
50 мВ изменяет проводимость мембраны аксона
Общее число нейронов в ЦНС человека порядка 100.000.000.000
Каждая клетка связана в среднем с 10.000 других нейронов
Совокупность в объеме 1 мм*3 - независимая локальная сеть
Слайд 10Нервная ткань:
Лишена регенерации
Её нейроны способны формировать новые отростки и синаптические
контакты
Развитие нейронных ответвлений сопровождается конкуренцией за синаптические участки
Специфическая изменчивость
нейронных сетей лежит в основе их способности к обучению
Слайд 12Нелинейное преобразование
Маккалок - Питтс
Линейная
Сигмоидальная
Слайд 13Перцептрон Розенблата
S- сенсорные, А - ассоциативные, R - рефлекторные
Розенблат:
нейронная сеть рассмотренной
архитектуры будет способна к воспроизведению любой
логической функции.
(неверное предположение)
Слайд 14Обучение сети
Обучить нейронную сеть это значит, сообщить ей, чего от
нее добиваются.
Показав ребенку изображение буквы и получив неверный ответ, ему
сообщается тот, который хотят получить.
Ребенок запоминает этот пример с верным ответом и в его памяти происходят изменения в нужном направлении.
Слайд 15Обучение перцептрона
Начальные значения весов всех нейронов полагаются случайными.
Сети предъявляется входной образ xa, в результате формируется
выходной образ.
Слайд 16Обучение перцептрона
Вычисляется вектор ошибки, делаемой сетью на выходе.
Идея: изменение вектора весовых коэффициентов в области малых
ошибок должно быть пропорционально ошибке на выходе.
Слайд 17Обучение перцептрона
Вектор весов модифицируется по следующей формуле:
- темп обучения.
Слайд 18Параметры
Обучение проводится для всех обучающих векторов.
Один цикл предъявления всей выборки
называется эпохой.
Обучение завершается по истечении нескольких эпох, когда вектор весов
перестанет значимо меняться.
Слайд 19Возможности применения
Теорема о полноте:
Любая непрерывная функция может быть
приближена функциями, вычисляемыми нейронными сетями.
Нейронные сети являются универсальными структурами, позволяющими
реализовать любой алгоритм!
Слайд 20Этапы построения сети
Выбор архитектуры сети
Число входов
Функции активации
Как соединить нейроны
Что взять
за вход, что за выход
Подбор весов (обучение сети)
Построить вручную
Воспользоваться пакетом
нейросетевого моделирования
Слайд 21STATISTICA
Neural Networks
Программный пакет для создания и обучения нейронных сетей и
работы
с нейросетевыми моделями
StatSoft® Russia
Слайд 22Исключительная простота в работе
Советник по конструированию сети
Мастер решения
задач
Богатые средства визуализации
STATISTICA Neural Networks
Слайд 23STATISTICA Neural Networks:
работа с данными
Структура таблиц исходных данных:
числовые и номинальные
переменные;
входные и выходные переменные;
подмножества наблюдений.
Импорт файлов различных форматов, использование буфера
обмена.
Подготовка данных: встроенные алгоритмы пре- и пост-процессирования.
Слайд 24STATISTICA Neural Networks:
построение сетей
Создание и сохранение наборов сетей.
Выбор типа сети:
многослойные
персептроны (MLP);
радиальные базисные функции (RBF);
вероятностные и обобщенно-регрессионные сети (PNN и
GRNN);
сети Кохонена.
Задание функции ошибок, функций активации и PSP-функций различных слоев.
Доступ к весам всех нейронов сети.
Слайд 25STATISTICA Neural Networks:
обучение сетей
Большой выбор алгоритмов обучения:
обратное распространение ошибки;
спуск по
сопряженным градиентам;
квази-ньютоновский и Левенберга-Маркара;
метод псевдообратных матриц.
Использование кросс-проверки.
Задание условий остановки.
Контроль за
процессом обучения с помощью графика среднеквадратичной ошибки и гистограммы ошибок наблюдений.
Слайд 26STATISTICA Neural Networks:
работа с сетью
Оценки качества обучения и работы сети:
статистики
регрессии;
статистики классификации;
построение поверхностей отклика.
Прогон всего набора данных и отдельных наблюдений.
Построение
прогноза
временного ряда.
Слайд 27STATISTICA Neural Network:
дополнительные функции
Генетический алгоритм отбора
входных данных
Нелинейное понижение размерности
Регуляризация весов
по Вигенду
Анализ чувствительности
Введение матрицы потерь
Операционные характеристики
Слайд 28STATISTICA Neural Networks:
создание приложений
Взаимодействие с системой STATISTICA: передача данных и
графиков.
Встроенный интерфейс прикладного программирования (API) для создания приложений в среде
Visual Basic и C++.
Новая функция - генератор программного кода на языке Си.
Слайд 29Прогнозирование результатов выборов президента США
Слайд 30Условия моделирования
Предвыборные компании кандидатов отработаны добросовестно
Все участники сделали все возможное
Выбор
практически предопределяется лишь объективными признаками?
Прогноз составлялся в 1992 году по
данным выборов начиная с 1864
Слайд 31Входные данные
Правящая партия у власти более 1 срока?
Правящая партия получила
больше 50% на прошлых выборах?
В год выборов была активна третья
партия?
Была серьезная конкуренция при выдвижении кандидата от правящей партии?
Слайд 32Входные данные
Кандидат от правящей партии был президентом в год выборов?
Был
ли год выборов временем спада или депрессии?
Был ли рост среднего
национального валового продукта на душу населения более 2,1%?
Произвел ли правящий президент существенные изменения в политике?
Слайд 33Входные данные
Во время правления были существенные социальные волнения?
Администрация правящей партии
виновна в серьезной ошибке или скандале?
Кандидат правящей партии - национальный
герой?
Кандидат оппозиционной партии - национальный герой?
Слайд 38Прогноз
Результат = 2 -
прогнозируется победа
кандидата
из оппозиции
Слайд 39Анализ чувствительности
Нажатие этой кнопки
автоматически исключает
незначимые переменные
из анализа
Слайд 40На основе экспертных данных выявить факторы, наиболее влияющие на прибыль
предприятия
Слайд 41Представлены факторы
Затраты на материалы
Объем зарплаты
Производительность труда
Курс доллара США
Слайд 44Анализ чувствительности
Объем зарплаты и
производительность
труда сильно влияют
на прибыль предприятия
Слайд 46
Анализ и прогнозирование
объема продаж сетей
автозаправочных
станций в США
Слайд 48Выходная переменная
автоматически подается
на вход сети
Слайд 53Обсуждение результатов
Глубина
прогноза
Отправная
точка
Слайд 57Качество результатов
сравнимо
с классическими
методами.
Слайд 58Качество прогноза
Для повышения качества прогноза рекомендуется добавить к исходной переменной
ряд, определяемый как Dy(t)=y(t)-y(t-1)
Точность прогноза
увеличилась на порядок!
Слайд 59Модель распределенной нейронной памяти
Каждый нейрон может находиться в
двух состояниях:
S1 = +1 - возбужденное
S2 = -
1 - покой
Нейроны связаны между собой синаптическими связями, которые бывают возбуждающие и тормозящие.
Слайд 60Модель распределенной нейронной памяти
Тормозящий
S1 = +1
S2 = - 1
Возбуждающий
S1 =
+1
S2 = + 1
Связь можно описывать коэффециентом:
Слайд 61- потенциальная энергия связи
Любая система предоставленная самой себе
стремится
к минимуму своей потенциальной
энергии.
Слайд 62Модель Хопфилда коэффициентов
межнейронных связей, когда в сети запомнено
p
образов.
Образ
Каждому образу соответствует
локальный энергетический минимум!
Слайд 63Бимодальный образ
Качественный вид потенциальной функции Хопфилда
Слайд 64Модель Хакена
Образы описываются параметрами порядка: d1 и d2
Переменные, описывающие степень
насыщения внимания: k1 и k2
Слайд 65Уравнения насыщения
При некотором соотношении между константами
А, B, g имеет место
осцилляция внимания!
Слайд 66Период колебаний
При зрительном восприятии:
T = 10c
При смысловой неоднозначности: «Продается
собака. Неприхотлива в еде. Любит детей.»
T = 0.1c
Разница объясняется существенной
разницей нервного вещества, вовлеченного в эти процессы.
Слайд 67Мы обсудили
Проблему неоднозначности в искусстве
Биологические нейронные сети
Математические модели нейронных сетей
Возможности
пакета SNN
Задачу: прогноз результатов выборов президента США
Слайд 68Мы обсудили
Задачу: выявление показателей, влияющих на валовую прибыль предприятия (регрессионная
модель)
Задачу: прогнозирование временного ряда
Способ оценки периода колебаний зрительных образов в
сознании