Разделы презентаций


Система оптического распознавания документа 8 класс

Системы оптического распознавания символовПри coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по

Слайды и текст этой презентации

Слайд 1
Система оптического распознавания документа

Система оптического распознавания документа

Слайд 2Системы оптического распознавания символов
При coздании электронных библиотек и архивов путем

перевода книг и документов в цифровой компьютерный формат, при переходе

предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов.
Оптическое распознавание символов (англ. (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. (Википедия)
С помощью сканера несложно получить изображение cтpaницы текста в графическом файле.
Системы оптического распознавания символовПри coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный

Слайд 3
Сначала необходимо распознать структуру размещения текста на странице: выделить колонки,

таблицы, изображения и т. д.

Далее выделенные текстовые фрагменты графического

изображения страницы необходимо преобразовать в текст.

Однако для получения документа в формате текстового файла необходимо провести pacпазнование текста, т. е. преобразовать элементы графического изображения в последовательности текстовых символов.

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Далее выделенные

Слайд 4Хорошее качество текста Растровый метод распознавания текста
Если исходный документ имеет типографское

качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений),

то задача распознавания решается методом сравнения с растровым шаблоном.
Сначала растровое изображение страницы разделяется на изображения отдельных символов.
Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.
Хорошее качество текста Растровый метод распознавания текстаЕсли исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо

Слайд 5Плохое качество текста Структурный метод распознавания
При распознавании документов с низким качеством

печати (машинописный текст, факс и т. д.) используется метод распознавания

символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.).
Любой символ можно описать через набор параметров, определяющих взаимное расположение eгo элементов. Например, буква «Н» и буква «И» состоят из трех отрезков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между буквами в величине улов, которые составляет третий отрезок с двумя другими. При pacпознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего coответствуют распознаваемому символу.
Плохое качество текста Структурный метод распознаванияПри распознавании документов с низким качеством печати (машинописный текст, факс и т.

Слайд 6Программы распознавания текста
Преобразованием графического изображения в текст занимаются специальные программы

распознавания текста (Optical Character Recognition - OCR).
Современная OCR должна уметь

многое: распознавать тексты, набранные не только определенными шрифтами, но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст — это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата — скажем, формата Microsoft Word.


Программы распознавания текстаПреобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR).Современная

Слайд 7Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и

CuneiForm от Cognitive, используют как растровый, так и структурный методы

распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.
Существует также системы On-line распознавания текста: Online OCR и ABBYY FineReader Online (http://www.onlineocr.ru , http://finereader.abbyyonline.com)

Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так

Слайд 8Системы оптического распознавания форм
При проведении Единого государственного экзамена, при

заполнении налоговых деклараций и т. д. используются различного вида бланки

с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.
Системы распознавания рукописного текста. С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.
Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика