Слайд 2Цели занятия - 1
Обсудить язык разметки
Перечислить и объяснить недостатки HTML
Обсудить
архитектуру документов XML
Перечислить преимущества XML
Обсудить синтаксический анализатор
Слайд 3Цели занятия -2
Идентифицировать различные компоненты документа XML
Символьные данные
Комментарии
Инструкции обработки
Примитивы
Общие примитивы
Объявления
DOCTYPE
Ссылки на примитивы
Слайд 4История средств разметки
Документы записываются с помощью бумаги и ручки
Наборщики форматируют
документы
Средства, используемые наборщиками для форматирования документа
Слайд 5Язык разметки
Язык разметки определяет правила, которые помогают добавить смысловое значение
к содержимому и структуре документов
Языки классифицируются, как:
Stylistic Markup (Стилистическая разметка)
– Определяет представление документа
Structure Markup (Структурная разметка) – Определяет структуру документа
Semantic Markup (Семантическая или Смысловая разметка) – Определяет содержимое документа
Слайд 6SGML
Система форматирования документов была названа Generalized Markup Language (GML) –
Язык разметки общего назначения
Язык GML тщательно разрабатывался и дорабатывался и
в конечном итоге стал известен, как Standard Generalized Markup Language (SGML) – Стандартный язык разметки
SGML считается родоначальником всех языков разметки
Слайд 7Возможности языка SGML
Описывает язык разметки, позволяющий авторам создавать собственные тэги,
связанные с содержанием
Необходим файл, который должен содержать все правила этого
языка для его интерпретации
Язык разметки, производный от SGML, называется приложением SGML
Слайд 8HTML
HTML – это самый известный язык разметки, являющийся производным от
SGML
Он был создан для разметки технической документации, с тем, чтобы
документы могли бы передаваться между различными платформами в научном сообществе
Сейчас он используется и многими другими пользователями, которые заинтересованы в визуальном представлении своих документов
Слайд 9Недостатки HTML
Фиксированный набор тэгов
Технология представления не связана с содержанием
"Плоская" разметка
Излишнее
количество служебных данных
HTML не является международным языком
Невозможен обмен данными
Не имеет
надёжного механизма связывания
HTML не обеспечивает повторное использование
Слайд 10Примеры кода
HTML и XML
TOM CRUISE
CLIENT ID : 100
COMPANY
: XYZ Corp.
Email : tom@usa.net
Phone : 3336767
Street Adress : 25th St.
City : Toronto
State : Toronto
Zip : 20056
TOM CRUISE
100
XYZ Corp.
tom@usa.net
3336767
25th St.
Toronto
Toronto
20056
Код HTML
Код XML
Слайд 11XML -1
XML – это аббревиатура от Extensible Markup Language (XML)
– расширяемый язык разметки
Устраняет все недостатки, присущие HTML
Позволяет пользователю определить
собственный набор тэгов, а также даёт возможность понять их и другим пользователям
Гораздо более гибкий язык, чем HTML
Наследует свойства языка SGML и объединяет их с положительными свойствами HTML
Является более компактной версией SGML
Слайд 12XML -2
XML – это метаязык, который описывает другие языки
Данные, содержащиеся
в файле XML, могут быть выведены различными способами
Данные также могут
быть переданы в другие приложения для дальнейшей обработки
Таблицы стилей (Style sheets) помогают преобразовать структурированные данные в различные HTML-представления для вывода данных в различных браузерах
Слайд 13Архитектура XML - 1
XML поддерживает трёхзвенную архитектуру для обработки и
манипулирования данными
Может быть сгенерирован из существующих баз данных с использованием
масштабируемой трёхзвенной модели
Тэги XML представляют логическую структуру данных, которая может быть интерпретирована и использована различными способами в многочисленных приложениях
Среднее звено используется для доступа к многочисленным базам данных и трансляции данных в формат XML
Слайд 14XML Architecture -2
Настольный компьютер
Среднее звено
Хранение
Вид №1
Вид №2
база данных
Web‑сервер
БД Access, бизнес‑правила
интеграции
Вывод
Несколько видов, созданных из данных, основанных на XML
Доставка и обработка
данных
Обмен данными в формате XML через HTTP
Интеграция данных
XML создаётся или генерируется
База данных мэйнфрейма
Слайд 15XML – универсальный формат данных
HTML – это один язык разметки,
а XML является семейством языков разметки
Любой тип данных может быть
с лёгкостью определён в XML
XML популярен, благодаря широкому спектру областей его применения, а также потому, что он прост в использовании
XML имеет структурированный формат данных, который позволяет хранить сложные (составные) данные
Слайд 16Преимущества XML
Трёхзвенная архитектура обеспечивает лёгкость масштабирования и улучшенную безопасность
Преимущества XML
классифицируются следующим образом:
Преимущества в области бизнеса
Технологические преимущества
Слайд 17Преимущества в области бизнеса
Совместное использование информации
Позволяет отраслям бизнеса определять собственные
форматы данных в XML, с лёгкостью создавать средства для чтения
этих данных, для записи данных и для преобразования данных между XML и другими форматами
XML в составе одного приложения
Весьма мощный и гибкий язык для описания сложных свойств реального мира
Расширяемость – даёт приложению возможность дальнейшего роста и разработки без каких-либо радикальных изменений
Доставка содержания
Способность поддерживать различных пользователей и информационные каналы (механизмы доставки информации) для построения более эффективных приложений
Слайд 18Технологические преимущества
Технологические преимущества
Повторное использование данных
Разделение данных и представления
Расширяемость
Семантическая информация
Слайд 19Реальное использование языка XML
SABRE (сфера международного туризма)
Chemical Markup Language
(химический
язык разметки)
Слайд 20Структура документа XML
Документ XML состоит из наборов "примитивов" (“entities”), идентифицируемых
по неповторяющимся, уникальным именам
Все документы начинаются с примитива "корневой" (root)
или "документ" (document)
Примитивы – это псевдонимы для более сложных функций
Документы логически состоят из объявлений, элементов, комментариев, символьных ссылок и инструкций обработки
Слайд 21Правильно сформированные и корректные документы
Спецификация XML 1.0 определяет синтаксис XML
Документ
считается правильно сформированным, если он удовлетворяет минимальному набору требований, определённых
пользователем
Требования гарантируют, что используются правильные языковые конструкции, что они используются по назначению, именно так, как определено спецификацией языка XML.
Корректный документ – это правильно сформированный документ, который к тому же полностью соответствует правилам, определённым в DTD
DTD определяет правила, по которым XML выполняет разметку в документе, и должен неукоснительно их соблюдать.
Слайд 22Синтаксические анализаторы - 1
Синтаксические анализаторы помогают компьютеру интерпретировать файл XML
Существуют
два типа синтаксических анализаторов:
Синтаксический анализатор без проверки корректности
Синтаксический анализатор с
проверкой корректности
Слайд 23Синтаксические анализаторы - 2
XML файл
Прочие связанные файлы (такие, как DTD
файл)
Синтаксический анализатор загружает XML и другие связанные файлы для проверки:
является ли документ XML правильно сформированным и корректным
Дерево данных
Слайд 24Данные против разметки
Документ XML
Данные
Данные, которые описывают данные – Разметка
Тэги
и - это разметка
‘Tom Cruise’ – это символьные данные
Tom
Cruise
Слайд 25Создание документа XML
Этапы, которые вы должны пройти для создания документа
XML
Составление декларации XML
Создание корневого элемента
Создание кода XML
Проверка документа
Слайд 26Составление декларации XML
Помогает браузеру и читателю документа обработать документ
Синтаксис
Декларация
XML не является обязательной
Версия XML 1.0 принята по умолчанию
Сообщает синтаксическому
анализатору и другим приложениям о способе, которым должны быть обработаны данные в файле
Атрибуты “standalone” и “encoding” не являются обязательными, только номер версии обязателен
‘Standalone’ определяет, используется ли внешняя декларация или не используется
‘Encoding’ определяет кодировку символов, используемую автором
Слайд 27Создание корневого элемента
Может существовать только один корневой элемент
Он описывает функцию
документа
Каждый документ XML обязательно должен содержать корневой элемент
encoding=“UTP-8”?>
Слайд 28Создание кода XML
Это процесс создания собственных элементов и атрибутов в
соответствии с требованиями нашего приложения
Элементы – это базовые единицы содержимого
XML
Тэги сообщают пользовательскому агенту, что нужно сделать с содержимым, заключённым между начальным и конечным тэгами
Открывающий Содержание Закрывающий
тэг тэг
Aptech Ltd
Элемент
Части элемента
Слайд 29Комментарии
Специальная информация, которая приводится в документе для того, чтобы в
будущем читатель мог с нею ознакомиться, и которая должна игнорироваться
процессором, называется комментариями
Синтаксис
Пример
TOM CRUISE
Приведённый пример должен вывести только имя TOM CRUSIE, а другие имена воспринимаются, как комментарии
Слайд 30Инструкции обработки
Обработка информации является частью информации, значимой для приложения, использующего
документ XML.
Эти инструкции передаются непосредственно в приложение с помощью синтаксического
анализатора.
Декларация XML – это также агент обработки
Имя приложения
Информационная инструкция
Слайд 31Символьные данные
Текст между начальным и конечным тэгами определяется, как "символьные
данные" (‘character data’)
Символьные данные могут быть любыми допустимыми символами (Unicode)
Символьные
данные делятся на:
PCDATA
CDATA
Слайд 32PCDATA
Это означает parsed character data (обрабатываемые символьные данные)
PCDATA – это
текст, который будет обрабатываться синтаксическим анализатором
Тэги в этом тексте будут
восприняты, как разметка, а примитивы будут развёрнуты.
Предопределённые примитивы
Слайд 33CDATA
Это означает character data (символьные данные)
Не обрабатываются синтаксическим анализатором
CDATA используются
для обеспечения удобства включения больших блоков специальных символов.
Строку символов
‘]]>’ нельзя использовать внутри блока CDATA, так как она сигнализирует об окончании блока CDATA.
TOM CRUISE
tom@usa.com
]]>
Пример
Слайд 34Примитивы
Примитивы (Entities) используются в документе, чтобы сократить трудозатраты в тех
случаях, когда необходимо многократно вводить большие фрагменты текста в документ.
Существуют две категории примитивов:
Общие примитивы (General entities)
Синтаксис
Параметризованные примитивы (Parameter entities)
Синтаксис
Слайд 35Примеры использования примитивов
Параметризованные примитивы:
< CLIENT = "&APTECH;" PRODUCT = "&PRODUCT_ID;"
QUANTITY = "15">
Объявление примитива
Синтаксис
%PARAMETER_ENTITY_NAME;
Пример
%address;
Объявление примитива:
My Address 12 Tenth Ave. Suite 12 Paris, France">
Объявление примитива
Синтаксис
&ENTITY_NAME;
Пример
&address;
Слайд 36Декларации DOCTYPE
Декларация следует за декларацией XML в документе
XML
Синтаксис
CUSTOMERS [
]>
Слайд 37Атрибуты
Атрибут даёт информацию об элементе
Атрибуты включаются в стартовый тэг элемента
Атрибут
состоит из имени атрибута и значения атрибута
Пример
SONY
IBM
Слайд 38Итоги - 1
Язык разметки определяет набор правил, которые добавляют смысловую
нагрузку к содержанию и структуре документов.
XML – это расширяемый
язык, то есть мы можем определить собственный набор тэгов, и дать возможность другим сторонам (людям или программам) знать и понимать эти тэги. Это делает XML гораздо более гибким языком, чем HTML.
XML наследует свойства языка SGML и объединяет их с положительными свойствами HTML. XML может быть сгенерирован из существующих баз данных с использованием масштабируемой трёхзвенной модели. Основанные на XML данные не содержат информации о том, каким образом должны выводиться данные.
Документ XML состоит из наборов "примитивов" (“entities”), идентифицируемых по неповторяющимся, уникальным именам.
Правильно сформированный документ – это такой документ, который соответствует основным правилам XML.
Синтаксический анализатор помогают компьютеру интерпретировать файл XML.
Слайд 39Итоги - 2
Шаги, предполагаемые при создании документа XML:
Составление декларации XML
Создание
корневого элемента
Создание кода XML
Проверка документа
Символьные данные разделяются на PCDATA и
CDATA.
Примитивы (Entities) используются в документе, чтобы сократить трудозатраты в тех случаях, когда необходимо многократно вводить большие фрагменты текста в документ. Существуют две категории примитивов:
Общие примитивы
Параметризованные примитивы
Декларация следует за декларацией XML в документе XML.
Атрибут даёт информацию об элементе.