Разделы презентаций


Использование машинного перевода в системах поиска русскоязычной информации

Содержание

Информационная служба RUSSIAinfo создана в университете Хельсинки по инициативе и при поддержке Министерства Просвещения Финляндии RUSSIAinfo предлагает доступ к электронным ресурсам по России для академического международного круга

Слайды и текст этой презентации

Слайд 1Использование машинного перевода в системах поиска русскоязычной информации
RUSSIAinfo, университет Хельсинки
Компания

ПРОМТ, Санкт Петербург
Таня Пурсиайнен
Дарьяна Цугульская

Использование машинного перевода в системах поиска русскоязычной информацииRUSSIAinfo, университет ХельсинкиКомпания ПРОМТ, Санкт ПетербургТаня ПурсиайненДарьяна Цугульская

Слайд 2Информационная служба RUSSIAinfo создана в университете Хельсинки по инициативе и

при поддержке Министерства Просвещения Финляндии
RUSSIAinfo предлагает доступ к электронным

ресурсам по
России для академического международного круга
пользователей

Метаданные: на английским и на финском

Ресурсы: 32% на английском языке, 12% на финском языке, 55% на русском языке, 11% на других языках

Реферативная база данных

Поиск: на английским и на финском

Информационная служба RUSSIAinfo создана в университете Хельсинки по инициативе и при поддержке Министерства Просвещения Финляндии RUSSIAinfo предлагает

Слайд 3Для пользователей, не владеющих русским языком, RUSSIAinfo предлагает возможность машинного

перевода текстов с русского на английский (лицензия от ПРОМТ)
В настоящий

момент предлагается три способа использования машинного перевода: перевод текста, перевод URL, и автоматический перевод результата поиска

Качество перевода: самое высокое достигается при переводе текстов по экономической тематике (специальные словари)

Сотрудничество с компанией ПРОМТ позволит нам также повысить качество перевода текстов по другим тематикам

Цель подключения МП – повышения коэффициента полноты поисковой системы: русскоязычные ссылки не отбрасываются пользователем

Для пользователей, не владеющих русским языком, RUSSIAinfo предлагает возможность машинного перевода текстов с русского на английский (лицензия

Слайд 4Машинный перевод: черновой вариант перевода

Быстрый перевод текста с целью понять

смысл

Полное соответствие идеологии WWW: пользователь привык быстро «просматривать» веб-страницы и

немедленно получать информацию

Лингвистическая база, программная база. Общелексические и специальные словари.

Позволит решить одну из основных проблем многоязычного поиска информации: перевод поисковых выражений (фраз)

Машинный перевод: черновой вариант переводаБыстрый перевод текста с целью понять смыслПолное соответствие идеологии WWW: пользователь привык быстро

Слайд 5От чего зависит точность перевода?

Грамотность исходного текста: Грамматика, правописание
Наличие слов

в переносном значении, неологизмов, аббревиатур

От чего зависит точность перевода?Грамотность исходного текста: Грамматика, правописаниеНаличие слов в переносном значении, неологизмов, аббревиатур

Слайд 6Улучшение качества перевода специализированных текстов
Подключение специализированных словарей (Созданных ПРОМТ /

Созданных пользователем)
Создание списка зарезервированных слов
Пример: Перевод документации по

теме стоматология
1. С использованием созданного компанией ПРОМТ специализированного словаря
2. С использованием общелексического словаря
Улучшение качества перевода специализированных текстовПодключение специализированных словарей (Созданных ПРОМТ / Созданных пользователем) Создание списка зарезервированных слов Пример:

Слайд 7Example: The layer of material beneath tooth enamel is the

dentine. It too is composed of hydroxyapatite to the extent

of about 70 per cent, the remainder is collagen and water. The dentine matrix is perforated by a number of tiny canals which radiate from the pulp cavity to the surface. These are the dentine tubules.

Example:  The layer of material beneath tooth enamel is the dentine. It too is composed of

Слайд 8Создание специализированных словарей для RUSSIAinfo
Российские государственные учреждения:


Создание специализированных словарей для RUSSIAinfoРоссийские государственные учреждения:

Слайд 9Схема поиска информации с подключением машинного перевода:

пользователь

БД (англ.)
перевод документов х


n
x
результат

поиска
……
Релевантный результат(англ. фин.)
……
Релевантный результат(англ. фин.)
Релевантный результат(русский)
…..
Релевантный результат(русский)

поисковая команда (англ.)
найдено

документов n+x
Схема поиска информации с подключением машинного перевода:пользовательБД (англ.)перевод документов хnxрезультат поиска……Релевантный результат(англ. фин.)……Релевантный результат(англ. фин.)Релевантный результат(русский) …..Релевантный

Слайд 10Обратный перевод - с английского на русский - позволит направлять

поиск в русские поисковые системы путем перевода поисковых команд (Cross

Language Information Retrieval)

Перевод метаданных полученных результатов позволит повысить не только коэффициент полноты, но и коэффициент точности системы

Обратный перевод - с английского на русский - позволит направлять поиск в русские поисковые системы путем перевода

Слайд 11Схема поиска информации с подключением машинного перевода;
интеграция

русских баз данных (обратный перевод):

пользователь
Поисковая команда (англ.)

БД(англ.)


n
x
найдено документов n+x+y
перевод документов

х + y

перевод поисковой команды


результат поиска
Релевантный результат(англ. фин.)

Релевантный результат(англ. фин.)

Релевантный результат(русский)
Релевантный результат(русский)

Релевантный результат(русский)
Релевантный результат(русский)
Релевантный результат(русский)


y


БД(рус.)

перевод метаданных

Схема поиска информации с подключением машинного перевода;   интеграция русских баз данных (обратный перевод):пользовательПоисковая команда (англ.)БД(англ.)nxнайдено

Слайд 12Планы на будущее:
Создание двуязычных (многоязычных ?) тезаурусов

для поиска информации
Создание систем репрезентации поисковых команд и документов, не

зависящих от входного/выходного языков для многоязычного поиска информации
Планы на будущее:   Создание двуязычных (многоязычных ?) тезаурусов для поиска информацииСоздание систем репрезентации поисковых команд

Слайд 13СПАСИБО!
RUSSIAinfo, университет Хельсинки
Компания ПРОМТ, Санкт Петербург
Таня Пурсиайнен
Дарьяна Цугульская

СПАСИБО!RUSSIAinfo, университет ХельсинкиКомпания ПРОМТ, Санкт ПетербургТаня ПурсиайненДарьяна Цугульская

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика