Разделы презентаций


Новые информационные технологии

Содержание

Лекция № 25. Основные классы естественно-языковых систем.Системы обработки связных текстов

Слайды и текст этой презентации

Слайд 1Новые информационные технологии
Харламов
Александр Александрович
© 2012 МГЛУ
Ин. яз. им.

М. Тореза

Новые информационные технологииХарламов Александр Александрович © 2012 МГЛУИн. яз. им. М. Тореза

Слайд 2Лекция № 25. Основные классы естественно-языковых систем.
Системы обработки связных текстов

Лекция № 25. Основные классы естественно-языковых систем.Системы обработки связных текстов

Слайд 3Основные классы систем общения с ЭВМ, включающие в свой состав

ЕЯ-системы - Системы обработки связных текстов, в том числе: - Системы

реферирования ЕЯ информации - Системы сравнения (классификации) ЕЯ информации - Системы кластеризаци ЕЯ информации

21

Основные классы систем общения с ЭВМ, включающие в свой состав ЕЯ-системы   - Системы обработки связных

Слайд 411
Системы обработки связных текстов
Системы данного класса моделируют процесс понимания законченных

описаний определенных фрагментов действительности
Понимание текста трактуется как извлечение из

него всей существенной с точки зрения системы информации
11Системы обработки связных текстовСистемы данного класса моделируют процесс понимания законченных описаний определенных фрагментов действительности Понимание текста трактуется

Слайд 511
Системы реферирования текстов
Реферирование это извлечение наиболее важных или характерных фрагментов

из одного или многих источников информации
Новости, биржевые котировки, анонсы фильмов

– все это рефераты
11Системы реферирования текстовРеферирование это извлечение наиболее важных или характерных фрагментов из одного или многих источников информацииНовости, биржевые

Слайд 611
Системы реферирования текстов
Такие инструменты, как AutoSummarize в Microsoft Office, IBM

Intelligent Text Miner, Oracle Context и Inxight Summarizer осуществляют выделение

фрагментов из исходного документа и соединение их в короткий текст
Краткое же изложение текста предполагает передачу основной мысли текста, и не обязательно теми же словами
11Системы реферирования текстовТакие инструменты, как AutoSummarize в Microsoft Office, IBM Intelligent Text Miner, Oracle Context и Inxight

Слайд 711
Системы реферирования текстов
Требования к реферированию:
Объем аннотации, или реферата должен

составлять от 5 до 30% исходного текста
Необходима гарантия того,

что аннотация действительно является адекватной заменой текста
11Системы реферирования текстовТребования к реферированию: Объем аннотации, или реферата должен составлять от 5 до 30% исходного текста

Слайд 811
Системы реферирования текстов
Рефераты различаются по функции и целевым группам пользователей


- Реферат может быть повествовательным, информативным или критическим
- Реферат

может быть общим или ориентированным на специфического пользователя
11Системы реферирования текстовРефераты различаются по функции и целевым группам пользователей - Реферат может быть повествовательным, информативным или

Слайд 911
Системы реферирования текстов
По функциям
- Повествовательный реферат предоставляет достаточный объем информации,

чтобы создать представление об источниках
Информативный реферат содержит основную или

новую фактическую информацию
Критический реферат (обзор) сообщает суть информации и предлагает мнение о ней
11Системы реферирования текстовПо функциям- Повествовательный реферат предоставляет достаточный объем информации, чтобы создать представление об источниках Информативный реферат

Слайд 1011
Системы реферирования текстов
Распространение полнотекстовых поисковых механизмов и средств фильтрации информации,

адаптирующихся к требованиям конкретных пользователей, приводят к тому, что настраиваемые

под пользователя рефераты приобретают все большее значение
11Системы реферирования текстовРаспространение полнотекстовых поисковых механизмов и средств фильтрации информации, адаптирующихся к требованиям конкретных пользователей, приводят к

Слайд 1111
Системы реферирования текстов
Процесс реферирования распадается на три этапа:
анализ исходного текста
определение

его характерных фрагментов и
формирование соответствующего вывода

11Системы реферирования текстовПроцесс реферирования распадается на три этапа:анализ исходного текстаопределение его характерных фрагментов иформирование соответствующего вывода

Слайд 1211
Системы реферирования текстов
Подходы к реферированию распадаются на две категории: без

опоры на знания и с опорой на знания
Иначе - статистические

и синтаксические
Еще по другому: метод составления выдержек, и формирование краткого изложения
11Системы реферирования текстовПодходы к реферированию распадаются на две категории: без опоры на знания и с опорой на

Слайд 1311
Системы реферирования текстов
Метод составления выдержек акцентирует на характерных фрагментах (как

правило, предложениях)
Выделяются блоки наибольшей лексической и статистической релевантности
Итоговый документ

— просто соединение выбранных фрагментов
11Системы реферирования текстовМетод составления выдержек акцентирует на характерных фрагментах (как правило, предложениях)Выделяются блоки наибольшей лексической и статистической

Слайд 1411
Системы реферирования текстов
В большинстве методов применяется модель линейных весовых коэффициентов

Основу аналитического этапа составляет процедура назначения весовых коэффициентов для блоков

текста в соответствии с расположением в оригинале, частотой появления, частотой использования в ключевых предложениях
11Системы реферирования текстовВ большинстве методов применяется модель линейных весовых коэффициентов Основу аналитического этапа составляет процедура назначения весовых

Слайд 1511
Системы реферирования текстов
Сумма весов, определенная после дополнительной модификации в соответствии

со специальными параметрами настройки, дает общий вес всего блока текста


11Системы реферирования текстовСумма весов, определенная после дополнительной модификации в соответствии со специальными параметрами настройки, дает общий вес

Слайд 1611
Системы реферирования текстов
В отличие от метода подбора выдержек, для подготовки

краткого изложения информации требуются мощные вычислительные ресурсы для систем обработки

естественных языков, в том числе грамматики и словари для синтаксического разбора и генерации естественно-языковых конструкций. Необходима ориентация на предметную область
11Системы реферирования текстовВ отличие от метода подбора выдержек, для подготовки краткого изложения информации требуются мощные вычислительные ресурсы

Слайд 1711
Системы реферирования текстов
Метод формирования краткого изложения опирается на понимание естественного

языка. Синтаксический разбор входит составной частью в этот метод анализа

11Системы реферирования текстовМетод формирования краткого изложения опирается на понимание естественного языка. Синтаксический разбор входит составной частью в

Слайд 1811
Системы реферирования текстов
Подход на основе понимания естественного языка
Формируются концептуальные репрезентативные

структуры всей исходной информации. В качестве таких структур могут быть

использованы формулы логики предикатов, семантическая сеть или набор фреймов
11Системы реферирования текстовПодход на основе понимания естественного языкаФормируются концептуальные репрезентативные структуры всей исходной информации. В качестве таких

Слайд 1911
Системы реферирования текстов
Избыточная информация устраняется путем удаления поверхностных суждений или

отсечения концептуальных подграфов
Затем информация подвергается дальнейшему агрегированию путем слияния графов

(или шаблонов) или обобщения информации
11Системы реферирования текстовИзбыточная информация устраняется путем удаления поверхностных суждений или отсечения концептуальных подграфовЗатем информация подвергается дальнейшему агрегированию

Слайд 2011
Системы реферирования текстов
В результате преобразования формируется концептуальная репрезентативная структура реферата,

по существу, концептуальные «выжимки» из текста
Затем на основе шаблонов

синтезируется связный текст реферата
11Системы реферирования текстовВ результате преобразования формируется концептуальная репрезентативная структура реферата, по существу, концептуальные «выжимки» из текста Затем

Слайд 2111
Системы реферирования текстов
Выдержки vs изложение
Методы извлечения выдержек легко настроить

для обработки крупных массивов информации. Текст реферата лишен связности
Метод формирования

кратких изложений выдает более сложные аннотации, которые нередко содержат информацию, дополняющую исходный текст
11Системы реферирования текстовВыдержки vs изложение Методы извлечения выдержек легко настроить для обработки крупных массивов информации. Текст реферата

Слайд 2211
Статистический анализ текстов
Глобальная семантическая структура текста включает в себя одномоментно

все ключевые понятия текста вместе с их взаимосвязями (и потому

может считаться статической парадигматической структурой)
11Статистический анализ текстовГлобальная семантическая структура текста включает в себя одномоментно все ключевые понятия текста вместе с их

Слайд 2311
Лингвистический (синтаксический) анализ предложений текста
Локальная смысловая структура предложения включается в

цепочку подобных структур по длине текста и формирует синтагматичскую динамическую

прагматическую структуру
11Лингвистический (синтаксический) анализ предложений текстаЛокальная смысловая структура предложения включается в цепочку подобных структур по длине текста и

Слайд 2411
Лингвистический (синтаксический) анализ предложений текста
Смысловые структуры предложений представлены ключевыми понятиями

связанными некоторыми отношениями
Наилучшим образом эти смысловые структуры могут быть представлены

предикатной структурой предложения
11Лингвистический (синтаксический) анализ предложений текстаСмысловые структуры предложений представлены ключевыми понятиями связанными некоторыми отношениямиНаилучшим образом эти смысловые структуры

Слайд 2511
Лингвистический (синтаксический) анализ предложений текста
Предикат (лат. praedicatum – заявленное, упомянутое,

сказанное) – термин логики и языкознания, обозначающий то, что высказывается

(утверждается или отрицается) о субъекте
Предикат – не всякая информация о субъекте, но указание на признак субъекта, его состояние и отношение к другим объектам
11Лингвистический (синтаксический) анализ предложений текстаПредикат (лат. praedicatum – заявленное, упомянутое, сказанное) – термин логики и языкознания, обозначающий

Слайд 2611
Лингвистический (синтаксический) анализ предложений текста
Структура предиката: Subj – субъект, Obji

– актанты предиката, Ri – отношения предиката, R0 – отношение

«быть субъектом»
11Лингвистический (синтаксический) анализ предложений текстаСтруктура предиката: Subj – субъект, Obji – актанты предиката, Ri – отношения предиката,

Слайд 2711
Лингвистический (синтаксический) анализ предложений текста
Ядро предиката (предикатор), в общем случае,

- это глагольная конструкция, которая может иметь дополнительно атрибутивные компоненты
Актанты

могут быть представлены или в виде отдельных объектов, или в форме конкретных характеристик предикатора, представленных наречиями
11Лингвистический (синтаксический) анализ предложений текстаЯдро предиката (предикатор), в общем случае, - это глагольная конструкция, которая может иметь

Слайд 2811
Лингвистический (синтаксический) анализ предложений текста
Таким образом, четырех частей речи (существительное,

глагол, прилагательное, наречие) достаточно для описания произвольной ситуации внешнего мира,

потому что местоимение и числительное всегда функционально эквивалентные существительному, а другие части речи выполняют служебные функции
11Лингвистический (синтаксический) анализ предложений текстаТаким образом, четырех частей речи (существительное, глагол, прилагательное, наречие) достаточно для описания произвольной

Слайд 2911
Лингвистический (синтаксический) анализ предложений текста
В процессе синтаксического анализа из предложений

текста выделяются содержащиеся в них предикатные структуры, а также отношения

сочинения, и атрибутивные отношения
11Лингвистический (синтаксический) анализ предложений текстаВ процессе синтаксического анализа из предложений текста выделяются содержащиеся в них предикатные структуры,

Слайд 3011
Лингвистический (синтаксический) анализ предложений текста
Общую схему действий по выявлению предикатной

структуры можно представить в виде последовательности шагов:
Членение предложения на

начальные сегменты
Построение синтаксических групп для каждого сегмента с помощью синтаксических правил
Установление иерархии между сегментами с помощью синтаксических правил
11Лингвистический (синтаксический) анализ предложений текстаОбщую схему действий по выявлению предикатной структуры можно представить в виде последовательности шагов:

Слайд 3111
Прагматический анализ текста
Предикатные отношения между сущностями, представленными в предложениях текста,

выстраиваются в цепочку, как и предложения текста, в которых они

содержатся. Это размеченный ориентированный граф
11Прагматический анализ текстаПредикатные отношения между сущностями, представленными в предложениях текста, выстраиваются в цепочку, как и предложения текста,

Слайд 3211
Системы реферирования текстов
Разработчики средств реферирования все больше склоняются к гибридным

системам, а исследователям все более успешно удается объединять статистические методы

и методы, основанные на знаниях
11Системы реферирования текстовРазработчики средств реферирования все больше склоняются к гибридным системам, а исследователям все более успешно удается

Слайд 3311
Системы реферирования текстов
Методы оценки
Целью методов оценки рефератов является определение

адекватности (и достоверности) или пользы реферата по отношению к оригинальному

тексту
Сейчас известны две методики оценки. Первая – оценка «изнутри», вторая– оценка «извне»

11Системы реферирования текстовМетоды оценки Целью методов оценки рефератов является определение адекватности (и достоверности) или пользы реферата по

Слайд 3411
Системы реферирования текстов
При оценке «изнутри» оценивается насколько хорошо реферат отражает

основные идеи оригинала, оценивается гладкость текста
Во втором методе оценивается качество

реферата по тому, как он влияет на завершение той или иной работы, например, позволят ответить на вопросы, относящиеся ко всему содержанию текста

11Системы реферирования текстовПри оценке «изнутри» оценивается насколько хорошо реферат отражает основные идеи оригинала, оценивается гладкость текстаВо втором

Слайд 3511
Тенденции в автоматическом реферировании
Реферирование мультимедийной информации
Соответствующие технологии должны обрабатывать информацию

из источников разного типа на этапе анализа, на этапе извлечения

и на этапе синтеза, когда происходит интеграция информации разного типа
11Тенденции в автоматическом реферированииРеферирование мультимедийной информацииСоответствующие технологии должны обрабатывать информацию из источников разного типа на этапе анализа,

Слайд 3611
Системы реферирования текстов

11Системы реферирования текстов

Слайд 3711
Системы классификации
и кластеризации текстов
Под классификацией текста понимается отнесение текста

к одной из рубрик классификатора
Под кластеризацией корпуса текстов понимается разбиение

его на тематические рубрики
11Системы классификации и кластеризации текстовПод классификацией текста понимается отнесение текста к одной из рубрик классификатораПод кластеризацией корпуса

Слайд 3811
Системы классификации
и кластеризации текстов
Классификация текста строится на основе механизма

сравнения текстов
Кластеризация – на разбиении семантической сети корпуса текстов на

подсети
11Системы классификации и кластеризации текстовКлассификация текста строится на основе механизма сравнения текстовКластеризация – на разбиении семантической сети

Слайд 3911
Системы классификации
и кластеризации текстов
До того, как начать обработку текста,

его необходимо подготовить к виду, удобному для обработки

11Системы классификации и кластеризации текстовДо того, как начать обработку текста, его необходимо подготовить к виду, удобному для

Слайд 4011
Системы классификации
и кластеризации текстов
Используются различные способы представления текстов:
реферат

текста
список ключевых слов, содержащихся в тексте
список ключевых слов, объединенный в

сеть
11Системы классификации и кластеризации текстовИспользуются различные способы представления текстов: реферат текстасписок ключевых слов, содержащихся в текстесписок ключевых

Слайд 4111
Системы классификации
и кластеризации текстов
Первичная обработка текста
Текст на основе графематического

анализа сегментируется на слова и предложения
Удаляются общеупотребимые и
рабочие слова
Проводится

морфологический анализ оставшихся слов
11Системы классификации и кластеризации текстовПервичная обработка текстаТекст на основе графематического анализа сегментируется на слова и предложенияУдаляются общеупотребимые

Слайд 4211
Системы классификации
и кластеризации текстов
Первичная обработка текста
Наиболее часто встречающиеся слова

не несут смысла в предметной области текста
Они удаляются на основе

частотного анализа
11Системы классификации и кластеризации текстовПервичная обработка текстаНаиболее часто встречающиеся слова не несут смысла в предметной области текстаОни

Слайд 4311
Системы классификации
и кластеризации текстов
Первичная обработка текста
Более точно это можно

сделать, используя заранее вручную сформированные перечни общеупотребимых слов
Это позволяет устранить

информационный шум
11Системы классификации и кластеризации текстовПервичная обработка текстаБолее точно это можно сделать, используя заранее вручную сформированные перечни общеупотребимых

Слайд 4411
Системы классификации
и кластеризации текстов
Морфологический анализ
От слов отсекаются окончания и

слова заменяются их корневыми основами, которые могут содержать помимо корня

еще и суффикс (суффиксы)
11Системы классификации и кластеризации текстовМорфологический анализОт слов отсекаются окончания и слова заменяются их корневыми основами, которые могут

Слайд 4511
Системы классификации
и кластеризации текстов
Индексирование текста
Индексные понятия извлекаются из текста
Индекс

корректируется вручную

11Системы классификации и кластеризации текстовИндексирование текстаИндексные понятия извлекаются из текстаИндекс корректируется вручную

Слайд 4611
Системы классификации
и кластеризации текстов
Индексирование текста
Два фактора определяют эффективность использования

языка индексов: полнота и специфичность языка индексов
Полнота это количество

понятий, извлекаемых из текста (полнота описания содержания)
Специфичность – способность точно описать текст (разделять тексты)
11Системы классификации и кластеризации текстовИндексирование текстаДва фактора определяют эффективность использования языка индексов: полнота и специфичность языка индексов

Слайд 4711
Системы классификации
и кластеризации текстов
Простые способы статистической обработки текстов базируются

на частоте встречаемости слов в тексте

11Системы классификации и кластеризации текстовПростые способы статистической обработки текстов базируются на частоте встречаемости слов в тексте

Слайд 4811
Системы классификации
и кластеризации текстов
Закон Ципфа

Пусть f – частота встречаемости

слова в тексте, а r – ранг этого слова (степень

важности слова в тексте). Тогда кривая, связывающая ранг слова с частотой его встречаемости имеет вид гиперболы, что означает, что произведение частоты встречаемости на его ранг есть константа
11Системы классификации и кластеризации текстовЗакон ЦипфаПусть f – частота встречаемости слова в тексте, а r – ранг

Слайд 4911
Системы классификации
и кластеризации текстов
Закон Ципфа

11Системы классификации и кластеризации текстовЗакон Ципфа

Слайд 5011
Системы классификации
и кластеризации текстов
Взвешивание слов словаря индексов
Наиболее простой способ

взвешивания – выявление на частотной гиперболе слов в соответствие с

мысленной гауссианой: центр гауссианы приходится на наиболее весомые слова текста
11Системы классификации и кластеризации текстовВзвешивание слов словаря индексовНаиболее простой способ взвешивания – выявление на частотной гиперболе слов

Слайд 5111
Системы классификации
и кластеризации текстов
Взвешивание слов словаря индексов
Другой способ взвешивания

связан с частотным распределением слов в коллекции документов: чем в

меньшем числе текстов встречается понятие, тем оно более специфично
11Системы классификации и кластеризации текстовВзвешивание слов словаря индексовДругой способ взвешивания связан с частотным распределением слов в коллекции

Слайд 5211
Системы классификации
и кластеризации текстов
Взвешивание слов словаря индексов
Еще один способ

взвешивания – перенормировка в соответствие со структурой текста
Чем с большим

числом понятий связано слово в данном тексте, тем имеет больший вес
11Системы классификации и кластеризации текстовВзвешивание слов словаря индексовЕще один способ взвешивания – перенормировка в соответствие со структурой

Слайд 5311
Системы классификации
и кластеризации текстов
Автоматическое сравнение текстов
Под сравнением двух текстов

мы будем понимать степень пересечения некоторых признаков текстов
Такими признаками могут

быть индекс текста, или семантическая сеть
11Системы классификации и кластеризации текстовАвтоматическое сравнение текстовПод сравнением двух текстов мы будем понимать степень пересечения некоторых признаков

Слайд 54Перечень понятий vs сеть
European
citizenship
European unite
globalization
human right
citizens
ethnographic
cultural citizenship
research
nationality
global
social
European unite
entitlements
particularization
European citizenship

European
citizenship
European unite
globalization
human

right
citizens

Перечень понятий vs сетьEuropeancitizenshipEuropean uniteglobalizationhuman rightcitizensethnographiccultural citizenshipresearchnationalityglobalsocialEuropean uniteentitlementsparticularizationEuropean citizenshipEuropeancitizenshipEuropean uniteglobalizationhuman rightcitizens

Слайд 5511
Системы классификации
и кластеризации текстов
Автоматическая классификация (сравнение) текстов
Под классификацией текстов

мы будем понимать отнесение текста к одной или нескольким рубрикам

классификатора путем сравнения этого текста и текстов рубрик
11Системы классификации и кластеризации текстовАвтоматическая классификация (сравнение) текстовПод классификацией текстов мы будем понимать отнесение текста к одной

Слайд 5611
Системы классификации
и кластеризации текстов
Автоматическая классификация (сравнение) текстов
Большинство известных методов

классификации основаны на предположении, что тексты относятся к тематической рубрике

по отличительным признакам (словам или словосочетаниям – индексу текста)
11Системы классификации и кластеризации текстовАвтоматическая классификация (сравнение) текстовБольшинство известных методов классификации основаны на предположении, что тексты относятся

Слайд 5711
Системы классификации
и кластеризации текстов
Классификация на основе сравнения перечней индексов
Простая

классификация осуществляется определением степени пересечения индекса анализируемого текста и индексов

рубрик. В этом случае мера сравнения есть просто пересечение
11Системы классификации и кластеризации текстовКлассификация на основе сравнения перечней индексовПростая классификация осуществляется определением степени пересечения индекса анализируемого

Слайд 5811
Системы классификации
и кластеризации текстов
Кластеризация текстов
Под кластеризацией текстов понимается разбиение

множества текстов (корпуса текстов) на подмножества, которые группируются вокруг определенных

тем. Эти темы могут быть заданы заранее, а могут быть выявлены после того, как произведена группировка текстов
11Системы классификации и кластеризации текстовКластеризация текстовПод кластеризацией текстов понимается разбиение множества текстов (корпуса текстов) на подмножества, которые

Слайд 5911
Системы классификации
и кластеризации текстов
Кластеризация текстов
Кластерный анализ представляет собой совокупность

методов, подходов и процедур, разработанных для решения проблемы формирования однородных

классов (кластеров) в произвольной проблемной области
11Системы классификации и кластеризации текстовКластеризация текстовКластерный анализ представляет собой совокупность методов, подходов и процедур, разработанных для решения

Слайд 6011
Системы классификации
и кластеризации текстов
Кластеризация текстов
Процедура кластеризации заключается в разбиении

обучающей выборки на подмножества, называемые кластерами, так, чтобы каждый кластер

состоял из объектов, близких по некоторой метрике, а объекты разных кластеров отстояли друг от друга на значительном расстоянии
11Системы классификации и кластеризации текстовКластеризация текстовПроцедура кластеризации заключается в разбиении обучающей выборки на подмножества, называемые кластерами, так,

Слайд 6111
Системы классификации
и кластеризации текстов
Кластеризация текстов
Процедура кластеризации должна обладать свойством

интерпретируемости найденных кластеров в терминах смысла содержания относящихся к ним

документов
11Системы классификации и кластеризации текстовКластеризация текстовПроцедура кластеризации должна обладать свойством интерпретируемости найденных кластеров в терминах смысла содержания

Слайд 6211
Системы классификации и кластеризации текстов

11Системы классификации и кластеризации текстов

Слайд 63
Программная система
для анализа текстовой информации
TextAnalyst
Функциональность
Формирование семантической сети

– выявление ключевых понятий с их связями
Формирование тематической структуры текста


Формирование гипертекстового представления
Программная система для анализа текстовой информацииTextAnalystФункциональность Формирование семантической сети – выявление ключевых понятий с их связямиФормирование

Слайд 64
Программная система
для анализа текстовой информации
TextAnalyst
Функциональность
Ассоциативная навигация по

тексту
Формирование реферата, тематического реферата
Кластеризация текстов
Сравнение (классификация) текстов

Программная система для анализа текстовой информацииTextAnalystФункциональность Ассоциативная навигация по текстуФормирование реферата, тематического рефератаКластеризация текстовСравнение (классификация) текстов

Слайд 65
Программная система
для анализа текстовой информации
TextAnalyst
Этапы обработки текстовой информации

Первичная

обработка

Удаление нетекстовой информации
Сегментация на осмысленные фрагменты (предложения)
Удаление стоп-слов, рабочих

и общеупотребимых слов
Морфологическая обработка
Программная система для анализа текстовой информацииTextAnalystЭтапы обработки текстовой информацииПервичная обработкаУдаление нетекстовой информацииСегментация на осмысленные фрагменты (предложения)

Слайд 66
Программная система
для анализа текстовой информации
TextAnalyst
Этапы обработки текстовой информации
Формирование

частотного портрета текста
Вычисление частоты встречаемости корневых основ в тексте
Вычисление частоты

попарной встречаемости корневых основ в тексте
Формирование первичной ассоциативной сети
Выявление устойчивых словосочетений
Программная система для анализа текстовой информацииTextAnalystЭтапы обработки текстовой информацииФормирование частотного портрета текстаВычисление частоты встречаемости корневых основ

Слайд 67
Программная система
для анализа текстовой информации
TextAnalyst
Этапы обработки текстовой информации
Перенормировка

Перевычисление

весовых характеристик понятий

Программная система для анализа текстовой информацииTextAnalystЭтапы обработки текстовой информацииПеренормировкаПеревычисление весовых характеристик понятий

Слайд 68Семантическая сеть

Семантическая сеть

Слайд 69Формирование семантической сети
1. сегментация на смысловые фрагменты
2. удаление стоп-слов, рабочих

слов и
общеупотребимых слов
3. морфологический анализ
4. построение частотного портрета
5. перенормировка

Формирование семантической сети1. сегментация на смысловые фрагменты2. удаление стоп-слов, рабочих слов иобщеупотребимых слов3. морфологический анализ4. построение частотного

Слайд 70Сравнение сетей (пересечение сетей)

Сравнение сетей (пересечение сетей)

Слайд 71Построение реферата
97 In doing so, EU administration intends to

square the circle of European Union as the super nation-state

of the nation states of Europe.
95 In order for it not to become a threat perceived by the population in identity terms, the apparently forthcoming idea of European citizenship needs to address the concerns of both traditional and new ethnonational minorities at the state level and underneath.
98 2) what is your opinion about the right to vote and be elected in local elections, that has been granted to citizens of a European Union member state while residing in the territory of any other member state.
95 An American graduate student could set out to study how Spanish citizenship (of Spain, that is) relates to European citizenship.
99 The aim of this paper is also to open a methodological and conceptual reflection -- a goal which originated in my ongoing research on cultural citizenship and the creation of European identity (Delgado, 1997).
95 Latino communities in the United States, and the proposal of European identity made by the European Union Administration during the past five years.

The question of methodology is rarely raised within the field of
citizenship studies. Citizenship seems a well-defined concept. Its
technical and colloquial meaning coincide. As many empirical projects focus
on specific aspects of citizenship in particular regions, outlining the
scope of the project seems the only necessary methodological distinction.
When doing qualitative research, however, we discover that clear words
(such as citizenship and identity) in reality comprise a complex network of
behavior, emotions and history. Such and such person is Spanish, a Turkish
immigrant in Germany, a French Basque, etc. But soon enough we discover
that the limits and relations between these concepts are not so easy to
draw, just as the reality they try to account for is more subtle than what
the labels indicate. We decide that next time we will not ask what
nationality you are but rather, for instance: 1) whether you would relocate
to another European country if you were offered a position; 2) what is your
opinion about the right to vote and be elected in local elections, that has
been granted to citizens of a European Union member state while residing in
the territory of any other member state.

Another example may be useful. An American graduate student could set out
to study how Spanish citizenship (of Spain, that is) relates to European
citizenship. Her first discovery would be that while there is nothing wrong.....

Текст

Реферат

Построение реферата97  In doing so, EU administration intends to square the circle of European Union as

Слайд 72
Программная система
для анализа текстовой информации
TextAnalyst
Формирование семантической сети

Программная система для анализа текстовой информацииTextAnalystФормирование семантической сети

Слайд 73
Программная система
для анализа текстовой информации
TextAnalyst
Тематическая структура текста

Программная система для анализа текстовой информацииTextAnalystТематическая структура текста

Слайд 74
Программная система
для анализа текстовой информации
TextAnalyst
Формирование реферата

Программная система для анализа текстовой информацииTextAnalystФормирование реферата

Слайд 75
Программная система
для анализа текстовой информации
TextAnalyst
Разбиение сети на подсети

– подтемы

Программная система для анализа текстовой информацииTextAnalystРазбиение сети на подсети – подтемы

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика