Слайд 1ОБРАБОТКА ИЗОБРАЖЕНИЙ
И
РАСПОЗНАВАНИЕ ОБРАЗОВ
Визильтер Юрий Валентинович,
д.ф.-м.н., нач. отделения “Системы
интеллектуального анализа данных, технического зрения, улучшенного и синтезированного видения” ГосНИИАС,
Моржин
Александр Викторович
Слайд 6МАСШТАБ ВРЕМЕНИ
Рост раковой опухоли
Рост популяции
Рост
организма
Рост численности населения
Рост потребления энергии
Слайд 8ГЛАВНЫЙ ФАКТОР
Рост вычислительной мощности компьютеров в соответствии с законом
Мура
Слайд 9Очень близкое будущее (до 2040)
такое
Слайд 10Очень близкое будущее (до 2040)
или такое
Техническое зрение в системах управления - 2012
Unmanned
Aircraft Systems (UAS) Roadmap, 2005-2030
Слайд 12
Richard Rumpf
Rumpf Associates International, Inc.
14-16 марта 2012
Техническое зрение
в системах управления - 2012
Слайд 13Системы улучшенного и синтезированного видения
Слайд 14Цифровые изображения
Изображение как двумерный массив данных
Видимое поле представляет собой лишь
некоторую функцию распределения яркости или цвета на двумерной плоскости: f(x,y),
где x и y – декартовы координаты, описывающие плоскость изображения.
Цифровое изображение представляет собой двумерную матрицу Im[x,y] размера (DimX × DimY), где x – целое число от 0 до DimX – 1, описывающее номер элемента в строке матрицы, y – целое число от 0 до DimY – 1, описывающее номер строки матрицы, в которой расположен данный элемент.
Пиксель (pixel, picture element) – элемент цифрового изображения (ячейка прямоугольной матрицы). В простейшем случае каждый пиксель Im[x,y] имеет скалярное целочисленное значение, пропорциональное значению функции распределения яркости f(x,y) в данной точке плоскости.
Цифровое изображение как двумерная матрица интенсивностей
Цифровое изображение как псевдо-трехмерный рельеф
Слайд 15Цифровое изображение
Лабораторная система обработки и анализа изображений Pisoft Image
Framework
Слайд 16Физическая природа изображений
Изображения различных диапазонов длин волн
Диапазоны длин волн электромагнитного
излучения
Слайд 17Физическая природа изображений
Изображения различных диапазонов длин волн
Характеристики волн видимой части
спектра и прилегающих к ним
Слайд 18Изображения различных диапазонов длин волн
Области применения
Слайд 19Изображения различной физической природы
Области применения
Многоспектральные изображения:
ТВ и два ИК диапазона (3-5 и 8-14 мкм).
Слайд 20Типы изображений
Цветные изображения – специальный тип
данных, запись формата TcolorRef = {Red, Green, Blue}. Разрешение по
каждому из каналов – 8 бит. С целью выравнивания до «целого слова» 32-битной архитектуры часто дополняется еще одним 8-битным компонентом: TColorRef32 = {Red, Green, Blue, Reserved}. Цветное изображение – системный тип данных. Он поддерживается всеми устройствами ввода цветовых изображений. Кроме того, стандартный тип данных TRGBBitmap поддерживается операционной системой Windows как часть графического интерфейса на системном уровне;
Многозональные и гиперспектральные изображения – векторные, пиксель представляет собой массив целочисленных значений. Формируются специальными устройствами ввода. Используются для попиксельной классификации и сегментации изображений. На программном уровне, как правило, реализуются не как двумерный массив векторов, а как набор двумерных изображений, каждое из которых соответствует одной зональной или спектральной компоненте;
Слайд 21Компьютерное зрение как область компьютерной обработки информации
Компьютерное и
машинное зрение
Требования к системам и алгоритмам технического зрения:
надежность, точность, быстродействие.
Компьютерное зрение = "геометрия сегодня".
Приложения компьютерного зрения.
Слайд 22Компьютерное зрение
Проблемы, связанные с анализом изображений
Разнообразие яркостно-геометрических свойств изображения
(яркости, цвета, текстуры, формы, размеры…).
Изменчивость изображений (яркостная, ракурсная, загораживания…)
Необходимость базы знаний о мире для понимания сцен.
Основные целевые задачи
1. калибровка сенсоров, самоориентация и самопозиционирование;
2. обнаружение объектов и изменений в сцене наблюдения;
3. слежение за объектами;
4. реконструкция поверхностей и обнаружение трехмерных структур;
5. высокоточные измерения элементов сцены;
6. описание сцены и идентификация объектов;
7. организация зрительной обратной связи при работе управляемых устройств, манипуляторов или мобильных роботов в изменчивой среде.
Слайд 23Уровни и методы компьютерного зрения
Модульная парадигма (Д. Марр. «Зрение»)
Этапы
обработки данных:
предобработка изображений;
сегментация;
выделение геометрической структуры;
определение относительной
структуры и семантики.
Уровни обработки данных:
Низкий уровень – на входе изображение на выходе изображение (фильтрация простых шумов, гистограммная обработка);
Средний уровень – на входе изображение на выходе векторная информация, описание в виде элементов и связей между ними (сегментация);
Высокий уровень – на входе описание в терминах элементов изображения на выходе семантическая интерпретация в терминах видимой сцены объектного мира.
Слайд 24Термины и сопряженные технические дисциплины
Компьютерное зрение (computer vision) изучает теорию
и базовые алгоритмы анализа изображений и сцен.
Машинное зрение (machine vision)
включает компьютерное зрение и охватывает все проблемы разработки практических систем: выбор схем освещения исследуемой сцены, выбор характеристик датчиков, их количества и геометрии расположения, вопросы калибровки и ориентирования, выбор или разработку оборудования для оцифровки и процессорной обработки, разработку собственно алгоритмов и их компьютерную реализацию.
Слайд 25Термины и сопряженные технические дисциплины
Зрение роботов (robot vision) включает задачи
машинного зрения, решаемые в условиях жестких временных ограничений. Это разработка
основанных на изображениях информационных систем, входящих в состав систем управления сложными динамическими объектами (самолет, автомобиль, системы контроля технических и технологических процессов на производстве), а также формирование обратных связей по результатам обработки входных изображений в системах управления, что и требует их быстрого анализа в реальном масштабе времени.
Слайд 26Термины и сопряженные технические дисциплины
Обработка изображений (image processing) в узком
смысле – обработка нижнего уровня, когда результатом обработки изображения снова
является изображение.
Понимание изображений (image understanding) - обработка верхнего уровня, часто связанная с применения методов искусственного интеллекта и распознавания образов (pattern recognition).
Слайд 27Термины и сопряженные технические дисциплины
Цифровая фотограмметрия (digital photogrammetry) в узком
смысле – изучает метрические соотношения между точками снимков и реальной
сцены; в широком смысле – почти синоним машинного зрения: рассматривает сложные задачи анализа и 3D описания сцены по видеоданным оптических и других сенсоров.
Короткобазисная фотограмметрия (close-range photogrammetry) в узком смысле – решает задачи высокоточного измерения различных элементов видимой сцены и реконструкции форм трехмерных поверхностей с использованием стерео и многокамерной съемки, а также специального структурированного подсвета.
Слайд 28Требования к алгоритмам машинного зрения
робастность;
точность;
вычислительная реализуемость.
Факторы, осложняющие решение задач:
помехи
и «шум» – имеют десятки видов источников возникновения, к числу
которых можно отнести несовершенство сенсоров приемо-передающей аппаратуры и аппаратуры оцифровки изображений, трудные условия съемки, недостаток освещения и ряд других;
сложный текстурированный фон, на котором должно происходить обнаружение объектов, например, обнаружение штриховой наклейки на схожей с ней по структуре газетной странице и т.п.;
эффекты загораживания (заслонения) одних объектов другими объектами, как правило, не определенной заранее формы, например – облако на космофотоснимке и т.п., загораживающие помехи;
искажающие оптические эффекты в виде различных расфокусировок, дисторсий объективов, ракурсных искажений и др.;
Слайд 29Требования к алгоритмам машинного зрения
Факторы, осложняющие решение задач:
эффекты резкой
смены освещения, блики, тени, особенно в динамически меняющихся сценах;
разнообразие и
изменчивость самих объектов – переменная структура (как у текстовых строк, автомобильных номеров или штриховых кодов), возможные дефекты, временные изменения формы (сгибание-разгибание конечностей, движение механических частей машин), вегетационные циклы для растительности и т.п.;
эффекты изменения среды между сенсорами и объектами наблюдения – задымление, атмосферные осадки, пыль, искусственные помехи и многое другое;
несинхронность регистрации и обработки данных в динамических задачах, связанная с ограничениями быстродействия компьютерных средств хранения и анализа изображений – особенно критична для промышленных приложений с заданным временем реакции на событие. Сюда же можно отнести также сбои в компьютерных программах обработки.
Слайд 30Компьютерное зрение как обобщение школьной геометрии
Слайд 32Как найти окружность?
Проблема: Помимо полезных точек есть ложные
Слайд 33Метод общих геометрических мест
Задача 1: Построение треугольника по 3 заданным
отрезкам.
Слайд 34Метод общих геометрических мест
Задача 1: Построение треугольника по 3 заданным
отрезкам.
гмт1
Слайд 35Метод общих геометрических мест
Задача 1: Построение треугольника по 3 заданным
отрезкам.
гмт1
гмт2
Слайд 36Метод общих геометрических мест
Задача 1: Построение треугольника по 3 заданным
отрезкам.
гмт1
гмт2
гмт1 ∩ гмт2
Слайд 37Метод общих геометрических мест
Задача 2: Построение окружности по 3 заданным
точкам.
Слайд 38Метод общих геометрических мест
Задача 2: Построение окружности по 3 заданным
точкам.
гмт1
Слайд 39Метод общих геометрических мест
Задача 2: Построение окружности по 3 заданным
точкам.
гмт1
гмт2
Слайд 40Метод общих геометрических мест
Задача 2: Построение окружности по 3 заданным
точкам.
гмт1
гмт2
гмт1 ∩ гмт2
O
Слайд 41Метод общих геометрических мест
Задача 2: Построение окружности по 3 заданным
точкам.
гмт1
гмт2
гмт1 ∩ гмт2
R
O
Слайд 42Метод общих геометрических мест
Задача 2: Построение окружности по 3 заданным
точкам.
гмт1
гмт2
гмт1 ∩ гмт2
R
O
Слайд 43Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
Слайд 44Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
Слайд 45Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
гмт12
R
Слайд 46Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
гмт12
гмт23
∩ гмт
R
гмт ij
Слайд 47Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
гмт12
гмт23
гмт lk
Слайд 48Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
гмт12
гмт23
гмт ij
гмт lk
Больше голосов
Слайд 49Метод общих геометрических мест
Задача 3: Построение окружности по N заданным
точкам
гмт12
гмт23
MAX ∩ гмт
R
O
гмт ij
гмт lk
Слайд 50Компьютерное зрение
как школьная геометрия++
Отличия КЗ от классической геометрии:
1. Увеличение
числа точек на порядки.
2. Появление у точек атрибутов интенсивности, цвета
и других характеристик.
3. Рассмотрение не только правильных фигур, но и фигур любых других форм.
4. Учет всякого рода неидеальностей, погрешностей, шумов, искажений, дискретностей, неполной наблюдаемости и т.п. реальных факторов, которые, впрочем, также имеют математическое выражение.
Слайд 51Области применения и типовые примеры практических систем компьютерного и машинного
зрения.
Примеры приложений