Слайд 1Языки программирования
Язык – знаковая система
Знак
Смысл (денотат)
Цифры «45»
Число 45
Семантическая функция Val(«45»)
= 4 * 10 + 5
Слайд 2Языки программирования
Лексика
Орфография
Морфология
Синтаксис
Грамматика
Пунктуация
Семантика
Прагматика
Стиль
Слайд 3Лексика
Лексема – элементарная (относительно синтаксиса) единица языка
Примеры:
Числа: 123.4e2, 12, 0x25
Знаки:
+, !=, [,
if
Строки: “Hello, World”, “while + 1”
Символы: ‘a’
Слайд 4Лексика - пример
Идентификатор – последовательность букв и цифр, начинающаяся с
буквы
Вопросы:
Кириллица? Инд2
Регистр? PersonID = PeRSoniD
_? student_count, __FILE__, _1
Длина? TheBestApproximationReachedSoFar
Другие символы? IsLegal?
Пробелы?
Min X
Слайд 5Лексика – формальное описание
Регулярные выражения
(_|a|…|z)(_|a|…|z|0|…|9)*
Конечные автоматы
_ a … z
_
a … z 0 …9
иначе
иначе
Слайд 6Форма Бэкуса-Наура - БНФ
Нетерминал – определяемое понятие
Терминал – неопределяемый символ
Метасимволы
– ( ) ::= [ ] *
Правило грамматики
Нетерминал ::= последовательность
терминалов
и нетерминалов
Слайд 7Пример БНФ
буква ::= _
буква ::= a
...
буква ::= z
цифра ::= 0
…
цифра
::= 9
букра ::= буква
букра ::= цифра
букры ::=
букры ::=
букра букры
идент ::= буква букры
Слайд 8Регуляризованная БНФ - РБНФ
Альтернатива
разное ::= вариант1
...
разное ::= вариантn
Эквивалентно
разное ::=
вариант1 | ... | вариантn
Пример
буква ::= _ | a
| … | z
Слайд 9Регуляризованная БНФ - РБНФ
Необязательный элемент – возможное отсутствие
можетбыть ::=
можетбыть ::=
нечто
Эквивалентно
можетбыть ::= [ нечто ]
Пример
букры ::= [ букра
букры ]
Слайд 10Регуляризованная БНФ - РБНФ
Итерация – повторение ноль или более раз
(звезда Клини)
много ::=
много ::= нечто много
Эквивалентно
много ::= (нечто)*
Пример
букры ::=
(букра)*
Слайд 11Регуляризованная БНФ - РБНФ
Ненулевая итерация – повторение один или более
раз (плюс Клини)
много ::= нечто
много ::= нечто много
Эквивалентно
много ::=
(нечто)+
Пример
букра (букра)* экививалентно (букра)+
(букра)* экививалентно [(букра)+]
Слайд 12Пример РБНФ
буква ::= _
буква ::= a
...
буква ::= z
цифра ::= 0
…
цифра
::= 9
букра ::= буква
букра ::= цифра
букры ::=
букры ::=
букра букры
идент ::= буква букры
Слайд 13Пример РБНФ
буква ::= _|a|…|z
цифра ::= 0|…|9
букра ::= буква
| цифра
букры ::= (букра)*
идент ::= буква букры
Слайд 14Пример РБНФ
идент ::= буква (буква | цифра)*
буква ::= _|a|…|z
цифра ::=
0|…|9
Слайд 15Лексика
Разделители
Пробелы, переводы строк, табуляции
Значащие позиции: с 7 по 72
Комментарии: /*…*/
// до конца строки
Вложенные комментарии
Максимальность лексемы: a+++++b,
= 0.123e+1
ZERO = ZEROS = ZEROES = 0
Count = COUNT = count
Слайд 16Лексика – национальные версии (Алгол 60)
проц НОД(x,y,z);
знач x,y; цел x,y,z;
начало
цел проц ОСТ(A,B); знач A,B; цел A,B;
ОСТ := A – (A % B) * B;
начало
цел u;
для u := ОСТ(x,y) пока u ≠ 0 цикл
начало y := x; x := u конец;
конец;
z := x
конец
Слайд 17Лексика – национальные версии
(проблемы)
Для «правильного» перевода нужно менять не только
лексику, но и синтаксис, структуру фраз
Русские имена могут не допускаться
окружающей обстановкой
Использование «иноязычных» библиотек
Изображение данных:
числа: десятичная точка или десятичная запятая
даты: 09/01/04 или 04/01/09
Неудобство набора текста
опасность совпадения разных букв по начертанию
Слайд 18Лексика
Результат – поток лексем
Тип лексемы: идентификатор, строка, число...
Значение лексемы:
изображение, значение числа,....
Слайд 19Синтаксис
Правила построения фраз из лексем
Контекстно-свободный - структура фразы не зависит
от окружения
Контекстно-зависимый
Пример (Algol-68): .A x := 2
Описание переменной с
инициализацией, если А – тип
Присваивание 2 по адресу (.A x), если .A - операция
Слайд 20Контекстно-свободный синтаксис
Пример (РБНФ)
выр ::= перем
| конст
| (+ |
-) выр
| выр (= | < |
<> | + | - | * | /) выр
| ( выр )
Слайд 21Синтаксический вывод - дерево разбора
Выражение: x + 2 * y
Задача:
найти
последовательность
правил вывода
для заданной
цепочки
терминалов
выр + выр
перем
выр
перем
выр * выр
2
конст
y
x
((x) + ((2)
* (y) ) )
Слайд 22Синтаксический вывод
(неоднозначность)
Выражение: x + 2 * y
выр * выр
перем
выр
перем
выр +
выр
x
конст
2
y
( ( x + 2 ) * y )
Слайд 23Синтаксический вывод
(избыточность)
Допускается «лишнее»
Пример:
A < B + C < D
+ -
+ 2
X + - Y
Слайд 24Контекстно-свободный синтаксис
Пример – улучшенный вариант
выр ::= прост-выр [(= |
|
((+ | -) слаг)*
слаг ::= множ ((* | / ) множ)*
множ ::= (перем | конст | ( выр ))
Слайд 25Синтаксический вывод - дерево разбора
Выражение: x + 2 * y
слаг
+ слаг
выр
множ * множ
перем
2
конст
y
x
(x + ( 2 * y )
)
прост-выр
множ
перем
Слайд 26Неоднозначность if
if (x > 0)
if (x < 2)
x
= x+1;
else
x = x-1;
if (x > 0)
if
(x < 2)
x = x+1;
else
x = x-1;
Слайд 27Неоднозначность if
if (x > 0)
if (x < 2)
x
= x+1;
fi
else
x = x-1;
fi
Решение проблемы:
Слайд 28Синтаксические диаграммы
Структурированный ориентированный граф с одним входом и одним выходом,
вершинами которого являются нетерминалы и терминалы
Допускает цепочку терминалов на пути
от входа к выходу с «заходом» в диаграммы нетерминалов.
Слайд 29Синтаксические диаграммы
Вход:
Выход:
Обязательный:
Необязательный
Игнорируемый:
Слайд 30Синтаксические диаграммы
Выбор:
Необязательный выбор:
Выбор с умолчанием :
Слайд 31Синтаксические диаграммы
Повторение:
Повторение через разделитель:
Слайд 32Синтаксические диаграммы
идент ::= A..Z [(A..Z | 0..9)*]
Слайд 33Синтаксические диаграммы - пример
«Плохая» грамматика
Слайд 34Синтаксические диаграммы - пример
Улучшенная грамматика
выр ::= прост-выр [(= |
|
Слайд 35Синтаксические диаграммы - пример
прост-выр ::= [+ | -] слаг ((+
| -) слаг)*
слаг ::= множ ((* | /) множ)*
Слайд 36Синтаксические диаграммы - пример
множ ::= перем | конст | (
выр )
Слайд 37Синтаксические диаграммы – понятность пользователю
Критерии
чтобы не было слишком большим (умещалось
на странице)
чтобы не было слишком много диаграмм
Слайд 38Устойчивость синтаксиса
Случайные ошибки и опечатки должны обнаруживаться
Разные конструкции должны визуально
различаться
Примеры:
for (i = 0; i
(float x=0.0; x<=1,2; f=+0.1)
s = + f(x);
y = a[0]/2 + a[1]//3 + a[2]/5 + a[3]/7
+ a[4]/11 + a[5]/13 + a[6]/17 + a[7]/19;
10 DO I = 1.1,N
S = S * I
CONTINUE
.for i from 10 .to N .do
print(“ “)
.od;
Algol-68:
Fortran:
С:
Слайд 39Контекстно-зависимый анализ
Идентификация – сопоставление определений объектов с их использованиями
Статический анализ
типов – определение (вывод) типов объектов и выражений и проверка
типовой правильности.
Слайд 40Семантика
Что делает данная программа?
Функциональная семантика – функция, реализуемая программой
Операционная семантика
–последовательность (содержательных) действий выполняемая программой
Аксиоматическая семантика – следствие постусловий из
предусловий
Слайд 41Стиль
Лесенка - иногда обязательна (Occam), иногда поддерживается автоматически.
int l1 =
busy_class(cl, d*lessons_per_day + t1); if (t1==t || l1==-1 || lessons[l1]->
share[0].teacher != tch) continue; if (t1 < t-1 || t1>t+1) ++ not_sequence; else {++ total_class_overload; sum += B_CLASS_OVERLOAD; }
Неправильно
Слайд 42Стиль
Лесенка
int l1 = busy_class(cl, d*lessons_per_day + t1);
if (t1 == t
|| l1 == -1
|| lessons[l1]->share[0].teacher != tch)
continue;
/*
Не скупитесь на пробелы */
if (t1 < t-1 || t1 > t+1)
++ not_sequence;
else
{
++ total_class_overload;
sum += B_CLASS_OVERLOAD;
}
Слайд 43Стиль
Лесенка else if плохо
if (x >=1000)
….
else
if (x
> 0)
…
else
if (x == 0)
…
else
if (x > -1000)
…
else // x <= -1000
…
Слайд 44Стиль
Лесенка else if
if (x >=1000)
….
else if (x > 0)
…
else if
(x == 0)
…
else if (x > -1000)
…
else // x
-1000
…
Слайд 45Стиль
Содержательные, мнемоничные идентификаторы
int n1, n2;
for (int index_of_outer_loop = 0;
index_of_outer_loop < n1;
index_of_outer_loop ++)
for (int intIndexJ =
0; intIndexJ < n2; intIndexJ ++)
…
Неправильно
Слайд 46Стиль
Содержательные идентификаторы
int PersonCount, ExamCount;
for (int p = 0; p
PersonCount; p++)
for (int j = 0; j < ExamCount; j
++)
…
Длина идентификатора пропорциональна размеру области его действия
Слайд 47Стиль
Неиспользование умолчаний
int cnt = 0;
unsigned char line[128]
FILE * file;
…
while
( fgets(line, 127, file) != NULL)
cnt ++;
Слайд 48Комментарии
Совсем без комментариев – плохо
int max = 0;
for (int i
= 0; i < n; i++)
if (M[i] > max)
max =
M[i];
Слайд 49Комментарии
С плохими комментариями – ещё хуже
/* начальник приказал написать
комментарии к
каждой строчке
– ему же хуже будет :-[ */
int max
= 0; // присвоить 0
// перебираем i=0..n-1
for (int i = 0; i < n; i++)
if (M[i] > max) // сравниваем с max
max = M[i]; // обновляем, если надо
Слайд 50Комментарии
Комментарии облегчают понимание
/*
* Нахождение максимума max в массиве M
*/
int max = 0; // предполагается, что все M[i] >
0
for (int i = 0; i < n; i++)
if (M[i] > max)
max = M[i];
Слайд 51Прагматика
Использование конструкций языка согласно их предназначению
while (n
-n;
break;
}
if (n
(n<0 ? –n : n);
Слайд 52Преемственность
Fortran -> Fortran IV -> Fortran 77 -> Fortran 90
K&R
C -> ANSI C -> C++ -> C#
Обратная совместимость