Слайд 2Между природными явлениями и процессами связь бывает односторонней и взаимной.
Связи между явлениями (или корреляцию) определяют путем постановки серии опытов.
Математические методы позволяют установить тесноту таких связей с помощью корреляционного анализа.
Слайд 3Любой показатель связи служит приближенной оценкой рассматриваемой зависимости и не
является гарантией существования жесткой (функциональной) соподчиненности.
Вскрытие корреляции в географической
среде позволяет предвидеть, прогнозировать закономерности развития природы.
Слайд 4По форме корреляционная связь бывает
линейной и нелинейной (криволинейной),
по
направлению —
прямой и обратной,
по величине—,
от 0 до
±1
по количеству коррелируемых признаков — парной и множественной
Слайд 5Выделяют несколько видов
парной корреляционной связи:
а) параллельно-соотносительную, или ассоциативную,
когда оба признака изменяются сопряженно, частично под действием общих причин
и следствий (приуроченность растительности и почв к определенным формам рельефа);
Слайд 6б) субпричинную, когда один фактор выступает как отдельная причина
сопряженного
изменения признака (связь биомассы с количеством осадков);
в) взаимоупреждающую, когда
причина и следствие, находясь в устойчивой взаимной связи, последовательно влияют друг на друга.
Слайд 7Если на признак влияет несколько факторов, то приходится оценивать множественную
корреляцию.
Множественная корреляция служит основой выявления связей между признаками, но
требует строгой нормальности и прямолинейности распределения, поэтому использование ее затруднено
Слайд 8В практической работе по установлению корреляции между признаками и явлениями
необходимо придерживаться следующей последовательности:
на основании исследований определяют, существует ли
связь между рассматриваемыми признаками;
2) если связь между явлениями и признаками существует, устанавливают форму, направление и тесноту связи, используя график или корреляционную решетку.
Слайд 9В случае небольшой выборки составляются сопряженные вариационные ряды,
в которых следует определить
аргумент x и функцию у:
x 10 12 16 18 21 23 25 30
y 2 4 5 7 8 9 9 10
Сопряженные варианты наносятся на график, который помогает установить вид зависимости между аргументом и функцией.
От формы корреляционной связи зависит дальнейшая обработка аналитических данных.
Слайд 10Рисунок 1 - Формы корреляционной связи:
а—прямая линейная; б—обратная
линейная;
в—параболическая; г—гиперболическая
Слайд 11Рисунок 2 - Степень рассеяния частот и величина связи:
а –
r ≈ 0; б – r ≈ 0,5;
в – r ≈ 0,8
Слайд 12Прямолинейная зависимость (линейная зависимость) предполагает вычисление коэффициента корреляции r, а
нелинейная (криволинейная) зависимость — корреляционного отношения η(рис. 1).
Степень рассеяния
частот или вариант относительно линии регрессии на графике указывает ориентировочно на тесноту связи:
чем меньше рассеяние, тем сильнее связь (рис. 2).
Слайд 13Для взвешенных сопряженных вариационных рядов
при большом объеме выборочных совокупностей
строится корреляционная решетка (таблица 1)
Таблица 1 - Схема корреляционной решетки
Слайд 14В корреляционной решетке указываются середины классов сверху по горизонтали —
по аргументу х, слева по вертикали — по функции у.
В центре расположены частоты выделенных классов.
Справа по вертикали суммируются частоты по функции у, внизу по горизонтали — по аргументу х,
Сумма частот по вертикали и горизонтали дает один и тот же объем выборки N=65.
Исходя из распределения частот в корреляционной решетке, можно заключить,
что связь между аргументом и функцией нелинейная, поэтому в данном случае следует рассчитывать корреляционное отношение η.
Слайд 16Если зависимость между признаками на графике указывает на линейную корреляцию,
рассчитывают коэффициент корреляции r, который позволяет оценить тесноту связи переменных
величин, а также выяснить, какая доля изменений признака обусловлена влиянием основного фактора, какая — влиянием других факторов.
Слайд 17При положительной зависимости
величина коэффициента корреляции
изменяется от 0 до
+ 1,
при отрицательной — от 0 до -1.
Если
r = 0, то связь между признаками отсутствует.
Принято считать, что при
r < 0,5 корреляционная зависимость слабая,
при r = 0,5 - 0,7 - средняя,
при r = 0,7 - 0,99 — сильная.
Слайд 18Коэффициент корреляции приближенно характеризует тесноту связи между признаками.
Поэтому иногда
при высоком значении коэффициента корреляции и небольшом объеме выборки
связь
между признаками может быть слабой.
Мерой корреляционной связи является величина dxy, получившая название
коэффициента детерминации, который определяется по формуле
dху=r2 • 100%.
Слайд 19Коэффициент детерминации указывает на долю взаимной связи между признаками.
Например,
если r = 0,30, то dxy = 0,09,
т. е.
9 % всех изменений одного признака связано с изменением другого.
Отсюда следует, что значения r ≥ 0,70, при которых истинная взаимообусловленность признаков составляет около 50%,
можно считать высокими, значения r, равные 0,5-0,7,— средними и r ≤ 0,5— низкими.
Слайд 20Одна и та же величина коэффициента корреляции будет по-разному определять
достоверность зависимости признаков
для малых и больших выборок.
Например, при
Р=0,95 для N=5 достоверны значения
r ≥ 0,878,
для N=20 достоверной величиной будет r ≥ 0,444,
для N=100 достоверны значения
r ≥ 0,196.
Слайд 21Корреляционный анализ
решает следующие задачи:
установление направления и формы связи,
оценка тесноты
связи,
оценка репрезентативности статистических оценок взаимосвязи,
определение величины детерминации
(доли взаимовлияния)
коррелируемых
факторов.
Слайд 22Расчет коэффициента корреляции
для невзвешенных рядов
Слайд 24Достоверность вычисленного
коэффициента корреляции может быть определена двумя путями:
с
помощью таблицы коэффициентов корреляции (приложение 7) сравнить рассчитанный коэффициент корреляции
rф с табличным rт;
установить достоверность
коэффициента корреляции
через критерий Стьюдента.
Слайд 25Наиболее простой способ установления достоверности рассчитанного коэффициента корреляции
— сравнение
его с табличным значением.
Если rф>rт, то влияние фактора на
признак достоверно;
наоборот, если rф
Слайд 28Расчет коэффициента корреляции для взвешенных рядов
Слайд 29Сначала строится корреляционная решетка, по которой определяется форма связи между
признаками
Схема корреляционной решетки для расчета r во взвешенных рядах
Слайд 34Следует установить, достоверна ли зависимость между содержанием физической глины (х,
%) и содержанием магния в минеральных почвах (у, %).
Количество
пар наблюдений NП=70.
f = 8;
Мх=35,
My = 2,0
Слайд 35Далее вычисляют условные отклонения ах, ау, представляющие
собой отклонения середины
классов от среднего значения классов, деленные на классовый интервал,
т.
е. разницу между соседними серединами классов
(сх=15—5=10; cy =1—0,5=0,5).
Например для расчета ах и ау:
аx = (5-35):10= -3 для первого столбца,
ау = (3,5 – 2):0,5 = 3 для первой строки.
Затем вычисляются произведения условных отклонений на соответствующие им частоты (axfx; ayfy) и записываются в отведенные
для них столбцы и строки со своим знаком, например:
ayfy = 3·8 = 24; ахfх=(-3)·6= -18.
Квадраты условных отклонений умножаются
на соответствующие им частоты
Слайд 36Поскольку rф = 0,86 > rт = 0,30 при Р
= 0,99 и v = 68 (NП -2),
то зависимость
содержания общего магния от содержания физической глины в минеральной почве положительная, достоверная и достаточно высокая.
Слайд 37Исследованиями установлено, что на содержание подвижного марганца в почве влияет
реакция среды. Необходимо доказать достоверность установленной зависимости. Получены следующие исходные
данные
(х — гидролитическая кислотность, мг-экв. па 100 г почвы; у — содержание подвижного марганца, мг/кг почвы):
х 69 70 72 75 83 90 90 91 95 95
у 18 48 42 31 56 84 56 68 90 107
Слайд 40Зависимость между признаками не всегда выражается в виде
прямой линии.
Если рассеяние точек на графике приближается к кривой линии, то
зависимость устанавливается с использованием корреляционного отношения (η), величина которого изменяется только от 0 до 1.
Для него теоретические значения приводятся отдельно в таблице или находятся при перерасчете его в критерий Стъюдента.
При нелинейной корреляции вычисляется корреляционное отношение
(η - произносится Э Т А)
Нелинейная корреляция
Слайд 41Оценка прямой нелинейной зависимости между признаками
Слайд 43Следует установить, существует ли зависимость между температурой воздуха (х, оС)
и упругостью водяного пара
(у, мбар) по шести метеорологическим постам
Беларуси исходя из следующих данных:
Слайд 45Исходные данные по упругости водяного пара
Слайд 47Процесс упорядочения вариант по какому-либо признаку (например, увеличение или уменьшение
количества населения по районам) называют
ранжированием
Слайд 48Каждому члену ранжированного ряда присваивается ранг. Для обозначения рангов, как
правило, используются числа в пределах единиц и десятков, например: 1,
2, 3, ..., n.
Первой варианте или группе вариант присваивается ранг 1, второй варианте или группе – 2 и т. д.
Следует иметь в виду, что одни и те же варианты в зависимости от цели группировки могут иметь различные ранги.
Слайд 49Ранговую корреляцию можно применять для всех упорядоченных признаков (например, экспертные
оценки, баллы, бонитеты).
Объем сопряженных выборок должен быть не менее
пяти.
Коэффициент ранговой корреляции характеризуется следующими свойствами:
Слайд 50Если ранжированные варианты выборочных совокупностей имеют один и тот же
ранг независимо от цели ранжирования, то коэффициент корреляции должен быть
равен +1, т. е. существует полная положительная функциональная зависимость:
Слайд 512. Если ранги вариант в сравниваемых рядах выборочных
совокупностей расположены
в обратной последовательности,
то коэффициент корреляции
равен –1, т. е. будет
иметь место полная обратная функциональная зависимость:
Слайд 523. В других случаях коэффициент ранговой корреляции имеет значения между
+1 и –1, что больше соответствует фактической связи между признаками.
Слайд 53Для расчета зависимости (х, у) существуют следующие коэффициенты ранговой корреляции:
коэффициент неупорядоченности rн
коэффициент Спирмена rс.
Слайд 55Следует дать эстетическую оценку ландшафта для обоснования выбора зоны отдыха.
Предложено сравнить пять видов ландшафта (аргумент х), имеющих свои преимущества
с точки зрения чистоты и влажности воздуха, насыщенности полезными фитонцидами, характеризующихся разнообразием рельефа, растительности, наличием рек и водоемов.
Исходя из имеющихся показателей расположим виды ландшафта с учетом возрастающей оздоровительной и эстетической их роли (таблица 1). Соответственно этому видам ландшафта присваиваются ранги по возрастающей величине.
Таблица 1 - Оценка ландшафта для рекреационной цели
Слайд 56Для получения необходимых показателей при расчете рангового коэффициента корреляции составляем
таблицу 2.
Вычисляем разность между парными рангами (х'–у'), которые возводим
в квадрат и суммируем. Результаты используются для расчета рангового коэффициента корреляции по формуле.
Расчет рангового коэффициента корреляции
Слайд 57Для ранговой корреляции также вычисляются:
dху=r 2 • 100%.