Разделы презентаций


Инструменты для распознавания текстов и системы компьютерного перевода. Оценка

Содержание

Программы оптического распознавания документовДля ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Одной из наиболее известных программ такого типа является ABBYY FineReader.Бумажный носитель помещается под

Слайды и текст этой презентации

Слайд 1Инструменты для распознавания текстов и системы компьютерного перевода. Оценка количественных

параметров текстовых документов
Классная работа

Инструменты для распознавания текстов и системы компьютерного перевода. Оценка количественных параметров текстовых документовКлассная работа

Слайд 2Программы оптического распознавания документов
Для ввода текстов в память компьютера с

бумажных носителей используют сканеры и программы распознавания символов.
Одной из

наиболее известных программ такого типа является ABBYY FineReader.

Бумажный носитель
помещается под крышку сканера

В программе отдаётся команда
Сканировать и распознать (заранее необходимо выбрать языки распознавания)

Распознанный текст появляется в окне текстового редактора

Работа с программой распознавания текста

Программы оптического распознавания документовДля ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания

Слайд 3Программы оптического распознавания документов
Вместо сканера можно использовать цифровой фотоаппарат или

камеру мобильного телефона.
Фотографии текста
Отсканированные документы

Программы оптического распознавания документовВместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона. Фотографии текстаОтсканированные документы

Слайд 4Программа ABBYY FineReader
Программа позволяет сканировать и преобразовывать с оптическим распознаванием

изображения документов (фотографий, результатов сканирования, PDF-файлов) в электронные редактируемые форматы:
Microsoft

Word
Microsoft Excel
Microsoft Powerpoint
RTF
HTML
PDF
текстовый файл
Программа распознаёт множество языков, в том числе в одном тексте.

Одна из лучших в мире программа для оптического распознавания текста (192 языка). Разработана для операционных систем Microsoft Windows, macOS и Linux (проприетарное программное обеспечение).

Программа ABBYY FineReaderПрограмма позволяет сканировать и преобразовывать с оптическим распознаванием изображения документов (фотографий, результатов сканирования, PDF-файлов) в

Слайд 5Компьютерные словари
Компьютерные словари выполняют перевод отдельных слов и словосочетаний.
Компьютерные словари

обеспечивают мгновенный поиск словарных статей.
Многие словари предоставляют пользователям возможность прослушивания

слов в исполнении носителей языка.

Установлен на компьютер
как самостоятельная программа

Встроен в текстовый процессор

В on-line-режиме в сети Интернет

Компьютерный словарь

Компьютерные словариКомпьютерные словари выполняют перевод отдельных слов и словосочетаний.Компьютерные словари обеспечивают мгновенный поиск словарных статей.Многие словари предоставляют

Слайд 6Программа ABBYY Lingvo
Одной из наиболее известных программ-словарей. Имеются пакеты для

многих популярных операционных систем, таких как Windows, Windows Mobile, Symbian

OS, Mac OS X, iOS, Android (проприетарное программное обеспечение).

Включает сотни общелексических и тематических словарей для перевода и толковых словарей.
В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена.

Программа ABBYY LingvoОдной из наиболее известных программ-словарей. Имеются пакеты для многих популярных операционных систем, таких как Windows,

Слайд 7Конструирование текста
на требуемом языке
Для перевода текстовых документов применяются программы-переводчики.


Формальное знание языка
Анализ текста
на исходном языке
Программа-переводчик
Техническая
документация
Деловая
переписка
Компьютерные программы-переводчики

Художественный литературный перевод текста пока не возможен.

!

Конструирование текста на требуемом языкеДля перевода текстовых документов применяются программы-переводчики. Формальное знание языкаАнализ текста на исходном языкеПрограмма-переводчикТехническая

Слайд 8Одной из наиболее известных у нас программ-переводчиков является PROMT от

одноимённой российской компании PROMT (проприетарное программное обеспечение).
Программа PROMT
Существует множество различных

пакетов для дома и бизнеса. Множество языков.
Одной из наиболее известных у нас программ-переводчиков является PROMT от одноимённой российской компании PROMT (проприетарное программное обеспечение).Программа

Слайд 9Google Переводчик (англ. Google Translate) — веб-служба компании Google, предназначенная

для автоматического перевода части текста или веб-страницы на другой язык.
Google

Переводчик

На сегодня в переводчике доступны 103 языка.

translate.google.com

Google Переводчик (англ. Google Translate) — веб-служба компании Google, предназначенная для автоматического перевода части текста или веб-страницы

Слайд 10Представление текстовой информации в памяти компьютера
Текст состоит из символов - букв,

цифр, знаков препинания и т.д., которые компьютер различает по их

двоичному коду.

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.

на экране (символы)

в памяти – двоичные коды

Представление текстовой информации в памяти компьютераТекст состоит из символов - букв, цифр, знаков препинания и т.д., которые

Слайд 11Соответствие между изображениями символов и кодами символов устанавливается с помощью

кодовых таблиц.
Фрагмент кодовой таблицы ASCII

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.Фрагмент кодовой таблицы ASCII

Слайд 128-битные коды русских букв
Код ASCII содержит изначально 128 символов (0–127).

Среди них нет русских букв. 8-битные коды имеют 256 кодовых

комбинаций (28 = 256). Коды от 128 до 255 использовали для кодирования букв национального алфавита (в разных странах по разному, в одной стране оказалось несколько разных кодовых таблиц).

Кодовая таблица

0–31 – управляющие символы

33–127 – латинские буквы, знаки препинания, цифры, знаки арифметических операций

128–255 – буквы национального
алфавита

ASCII

32 – пробел

8-битные коды русских буквКод ASCII содержит изначально 128 символов (0–127). Среди них нет русских букв. 8-битные коды

Слайд 13Коды русских букв в разных кодовых таблицах

Коды русских букв в разных кодовых таблицах

Слайд 14Кодовая таблица символов Unicode позволяет пользоваться более чем двумя языками

в одном тексте.
В Unicode каждый символ кодируется шестнадцатиразрядным двоичным

кодом. Такое количество разрядов позволяет закодировать 65 536 различных символов: 216 = 65 536.
При использовании кодовой таблицы Unicode в тексте одновременно могут содержаться любые символы всех языков мира.

Увеличение мощности кода

Кодовая таблица символов Unicode позволяет пользоваться более чем двумя языками в одном тексте. В Unicode каждый символ

Слайд 15Информационный объём фрагмента текста
I = Ki
I – информационный объём сообщения
K

– количество символов
i – информационный вес символа
В зависимости от разрядности

используемой кодировки информационный вес символа текста может быть равен:
8 бит (1 байт) - восьмиразрядная кодировка;
16 бит (2 байта) - шестнадцатиразрядная кодировка.

Информационный объём фрагмента текста – это количество бит, байт (килобайт, мегабайт), необходимых для записи фрагмента оговорённым способом кодирования.

Информационный объём фрагмента текстаI = KiI – информационный объём сообщенияK – количество символовi – информационный вес символаВ

Слайд 16Задача 1. Считая, что каждый символ кодируется одним байтом, определите,

чему равен информационный объём следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут

к заблуждению, к истине – только один.

Решение
В данном тексте 57 символов (с учётом знаков препинания и пробелов). Каждый символ кодируется одним байтом. Следовательно, информационный объём всего текста – 57 байт.
Ответ: 57 байт.

Задача 1

Задача 1. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Жан-Жака

Слайд 17Задача 2. В кодировке Unicode на каждый символ отводится два

байта. Определите информационный объём слова из 24 символов в этой

кодировке.
Решение.
I = 24  2 = 48 (байт).
Ответ: 48 байт.

Задача 2

Задача 2. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объём слова из 24

Слайд 18Задача 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском

языке, первоначально записанного в 8-битовом коде, в 16-битовую кодировку Unicode.

При этом информационное сообщение увеличилось на 2048 байтов. Каков был информационный объём сообщения до перекодировки?
Решение
Информационный вес каждого символа в 16-битовой кодировке в два раза больше информационного веса символа в 8-битовой кодировке. Поэтому при перекодировании исходного блока информации из 8-битовой кодировки в 16-битовую его информационный объём должен был увеличиться вдвое, другими словами, на величину, равную исходному информационному объёму. Следовательно, информационный объём сообщения до перекодировки составлял 2048 байтов = 2 Кб.
Ответ: 2 Кбайта.

Задача 3

Задача 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 8-битовом коде, в

Слайд 19Ответ: 3,39 Мбайт.
K = 740  80  60
N =

256



I - ?

256 = 2i = 28, i = 8
К = 740  80  60  8 = 28 416 000 бит = 3 552 000 байт =
= 3 468,75 Кбайт 3,39 Мбайт.

I = K  i
N = 2i

Решение

Задача 4. Выразите в мегабайтах объём текстовой информации в «Современном словаре иностранных слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы). Считайте, что при записи использовался алфавит мощностью 256 символов.

Задача 4

Ответ: 3,39 Мбайт.K = 740  80  60N = 256

Слайд 20Задание
Откройте стр. 193 – Задание 4.16.
Создайте в личной папке (папка

Фамилия) файл типа документ Word с именем Формулы.
Выполните задание 4.16.
Закройте файл

с сохранением.
ЗаданиеОткройте стр. 193 – Задание 4.16.Создайте в личной папке (папка Фамилия) файл типа документ Word с именем

Слайд 21Работаем за компьютером

Работаем за компьютером

Слайд 22Прочитать §4.5 (стр. 174–177). Задания 2–6 (стр. 177) – устно.

Задание 3 (стр. 177) – письменно.
Выучить § 4.6 (стр. 178–183).

Повторить § 1.6 (стр. 45–50). Задания 2-7 (стр. 183–184) – устно.
Задания 8 (стр. 184) – письменно.
Написать конспект по презентации, выучить, выполнить задания.
Готовый файл пришлите мне на электронную почту akiwina82@mail.ru

Домашнее задание

Прочитать §4.5 (стр. 174–177). Задания 2–6 (стр. 177) – устно. Задание 3 (стр. 177) – письменно.Выучить §

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика