Слайд 1Обзор прикладных статистических программ для решения задач социологического исследования
Учебный курс
«Основы
применения прикладных статистических программ
в социологических исследованиях»
(лекция 1- 2)
Преподаватель: Цихончик
Надежда Васильевна, старший преподаватель кафедры философии и социологии САФУ
Слайд 2План лекции
Пакеты прикладных программ.
Пакеты прикладных программ для задач статистической обработки
данных:
Microsoft Excel
Statistica
SPSS (PSPP)
Vortex
другие пакеты
Слайд 31 вопрос лекции.
Пакеты прикладных программ
Слайд 4Пакеты прикладных программ
Пакеты прикладных программ (ППП) (application program package) – комплекс
взаимосвязанных программ для решения задач определенного класса конкретной предметной области.
Особенности:
Являются
самым многочисленным классом программных продуктов.
Предназначены для решения конкретных прикладных задач.
Установка программных продуктов на компьютер выполняется квалифицированными пользователями.
Эксплуатацию осуществляют конечные пользователи.
Программные продукты могут быть весьма специфичным для отдельных предметных областей
Слайд 6Общая характеристика статистических программ
2 группа - Методо-ориентированные ППП
Пакеты статистических программ
-компьютерные системы для анализа данных
ориентированы на решение общих проблем
обработки данных, например, на задачи обработки таблиц или на задачи статистического анализа
Цихончик Н.В., 2016
Слайд 7Виды статистических программ
Все программы статистической обработки данных можно разделить на
профессиональные, полупрофессиональные (популярные) и специализированные
Большую часть статистических пакетов можно разбить
на две группы — это статистические пакеты общего назначения и специализированные программные продукты
Цихончик Н.В., 2016
Слайд 8Виды статистических программ
Универсальные пакеты – отсутствие прямой ориентации на специфическую
предметную область, предлагают широкий диапазон статистических методов. Из зарубежных универсальных
пакетов наиболее распространены BAS, SPSS, Systat, Minilab, Statgraphics, STATISTICA
Специализированные пакеты - как правило, реализуют несколько статистических методов или методы, применяемые в конкретной предметной области. Из российских пакетов более известны STADIA, Олимп, Класс-Мастер, КВАЗАР, Статистик-Консультант; американские пакеты – ODA, WinSTAT, Statit и т.д.
Цихончик Н.В., 2016
Слайд 9Требования к статистическим пакетам общего назначения
1. содержит достаточно полный набор
стандартных статистических методов;
2. достаточно прост для быстрого освоения и использования;
3.
отвечает высоким требованиям к вводу, преобразованиям и организации хранения данных как в самом пакете, так и обмену с широко распространенными базами данных;
4. имеет широкий набор средств графического представления данных и результатов;
5. имеет подробную документацию, хорошо продуманную с учетом интересов как начинающего пользователя, так и специалиста-статистика.
Цихончик Н.В., 2016
Слайд 10Требования к СПП
модульность;
ассистирование при выборе способа обработки данных;
использование
простого проблемно-ориентированного языка для формулировки задания пользователя;
автоматическая организация процесса
обработки данных и связей с модулями пакета;
ведение банка данных пользователя и составление отчета о результатах проделанного анализа;
диалоговый режим работы пользователя с пакетом;
совместимость с другим программным обеспечением
Цихончик Н.В., 2016
Слайд 122 вопрос лекции.
Пакеты прикладных программ для задач статистической обработки
данных
Слайд 132.1. Microsoft Excel
(Microsoft Office Excel)
Слайд 14Электронные таблицы
(на примере Excel)
Microsoft Excel (Microsoft Office Excel) — программа
для работы с электронными таблицами, созданная корпорацией Microsoft.
Она предоставляет возможности
экономико-статистических расчетов
Цихончик Н.В., 2016
Слайд 15Статистические функции Excel
Цихончик Н.В., 2016
Слайд 16В мастере функций Excel
Функция СРЗНАЧ .
Функция МЕДИАНА
Функция МОДА
Функция ДИСП
Функция СТАНДОТКЛОН
Функция ЭКСЦЕСС
Функция СКОС
Функция КВАРТИЛЬ
Слайд 17Задания для самостоятельной работы
Наблюдение посещаемости четырех внеклассных мероприятий в экспериментальном
(20 человек) и контрольном (30 человек) классах дали значения (соответственно):
18, 20, 20, 18 и 15, 23, 10, 28. Требуется найти среднее значение, стандартное отклонение, медиану и квартили этих данных.
Найти среднее значение, медиану, стандартное отклонение и квартили результатов бега на дистанцию 100 м у группы студентов (с): 12,8; 13,2; 13,0; 12,9; 13,5; 13,1.
Определите верхнюю и нижнюю квартиль, выборочную асимметрию и эксцесс для данных измерений роста групп студенток: 164, 160, 157, 166, 162, 160, 161, 159, 160, 163, 170, 171.
Найти наиболее популярный туристический маршрут из четырех реализуемых фирмой, если за неделю последовательно были реализованы следующие маршруты: 1, 3, 3, 2, 1, 1, 4, 4, 2, 4, 1, 3, 2, 4, 1, 4, 4, 3, 1, 2, 3, 4, 1, 1, 3.
Слайд 18Инструмент «Пакет анализа»
В пакете Excel помимо мастера функций имеется набор более мощных
инструментов для работы с несколькими выборками и углубленного анализа данных,
называемый Пакет анализа, который может быть использован для решения задач статистической обработки выборочных данных
Слайд 20Statistica
Statistica — программный пакет для статистического анализа, разработанный компанией StatSoft, реализующий функции анализа данных, управления
данными, добычи данных, визуализации данных с привлечением статистических методов.
Слайд 21STATISTICA
На сегодняшний день разработана 10-я версия пакета (STATISTICA 10). Русифицирована
только 6-я версия (STATISTICA 6).
Стандартную комплектацию пакета STATISTICA составляют три
модуля, которые могут приобретаться как единым пакетом, так и отдельно.
Базовый пакет STATISTICA Base предоставляет обширные возможности выбора основных типов статистического анализа.
Цихончик Н.В., 2016
Слайд 22STATISTICA
Пакет предоставляет пользователям следующие возможности статистического анализа данных:
исследование корреляций между
переменными;
диаграмма рассеяния, матричная диаграмма рассеяния;
быстрые основные статистики и блоковые статистики
(интерактивные средства, позволяющие одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы);
интерактивный калькулятор вероятностных распределений (позволяет интерактивно исследовать структуру распределений, например, зависимость вероятности от параметров);
анализ многомерных откликов, многомерное шкалирование;
анализ при помощи временных рядов и прогнозирование временных зависимостей, в том числе анализ сезонных колебаний.
Слайд 23Достоинства STATISTICA
реализован обмен данными между STATISTICA и Windows-приложениями;
результаты анализа в
виде графиков, таблиц и текста могут быть сохранены в файле
с форматом RTF, который открывается и редактируется в MS Word;
возможность расширения системы при помощи создания программ на встроенном в STATISTICA языке программирования;
исходные данные из MS Excel можно легко импортировать в STATISTICA;
возможность записи макросов для автоматизации выполнения однотипных задач;
программа способна обрабатывать большие массивы данных – базы данных с числом переменных до 32 000 и практически неограниченным числом наблюдений.
Слайд 28STATISTICA
Самоучитель по пакету STATISTICA https://ieee.tusur.ru/books/statistica.pdf
Слайд 30SPSS
SPSS Statistics (аббревиатура англ. «Statistical Package for the Social Sciences» — «статистический
пакет для социальных наук») — компьютерная программа для статистической обработки данных,
один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках
Цихончик Н.В., 2016
Слайд 31SPSS
SРSS является модульной программой. Ее основу составляет базовый модуль (SPSS Base), позволяющий осуществлять управление
данными и содержащий наиболее распространенные методы статистического анализа данных: проведение описательной статистики;
построение линейных и нелинейных моделей; осуществление преобразования данных; проведение факторного, кластерного, дисперсионного анализов; вычисление корреляций; построение графиков; подготовка отчетов и пр.
Для проведения расширенного и углубленного анализа данных могут быть установлены дополнительные модули пакета. Для пакета IBM SPSS Statistics 23 разработаны 16 различных модулей
Цихончик Н.В., 2016
Слайд 32Достоинства SPSS:
развитый аппарат статистического анализа;
универсальность (может быть использован для решения
широкого круга вопросов из различных предметных областей, требующих проведения статистического
анализа данных);
широкий набор статистических и графических процедур (более 50 типов диаграмм) анализа данных, а также процедур создания отчетов;
высокая скорость вычислений, простой и удобный интерфейс;
детальная контекстно-ориентированная справочная система, позволяющая неопытному пользователю с большей легкостью ориентироваться в программе;
возможность свободного скачивания демонстрационной версии продукта на официальном сайте компании, наличие версий продукта на различных языках;
совместимость с операционными системами Windows, Mac, Linux;
наличие значительного количества литературы по работе с пакетом.
Недостатки SPSS:
высокие требования к системе компьютера (требуется 1GB оперативной памяти, 800MB памяти на жестком диске и процессор с частотой 1GHz и выше);
высокая цена по сравнению со статистическими пакетами аналогичного уровня (стоимость покупки для индивидуального пользования сроком на год составляет около 1000 долл.6).
Цихончик Н.В., 2016
Слайд 33Последняя версия SPSS включает в себя следующие новые возможности
импорт данных
из Excel и SAS;
экспорт результатов в MS Office, PDF; сохранение
результатов в формате HTML;
одновременная работа с несколькими наборами данных;
построение диаграммы для переменных с множественными ответами;
построение диаграммы с двумя осями Y;
улучшенный редактор синтаксиса с поддержкой автозавершения и цветового кодирования команд;
быстрая подготовка данных к анализу посредством Автоматизированной подготовки данных (IBM SPSS Data Preparation), позволяющей облегчить процесс интеллектуального анализа данных, выявляя и исправляя ошибки в данных и объясняя пропущенные значения. Также посредством этой функции можно подготовить отчет с рекомендациями о возможности использования данных для анализа.
Цихончик Н.В., 2016
Слайд 34SPSS
Учебное пособие по работе в программе SPSS
http://www.specialist.ru/course/spss1
Цихончик Н.В.,
2016
Слайд 35https://www.ibm.com/ru-ru/analytics/spss-trials
Слайд 36PSPP
PSPP — это свободное программное обеспечение для статистического анализа данных. У
PSPP имеются как графический пользовательский интерфейс, так и традиционный интерфейс
командной строки. Пакет может быть свободной заменой SPSS от IBM.
Слайд 38Vortex
Программа Vortex разрабатывается с 1992 года и применяется для обработки
данных социологических, маркетинговых, социально-политических, социально-психологических, социально-медицинских и других исследований.
Программа «VORTEX»
предназначена для:
разработки инструментария сбора данных (анкеты, бланка интервью, теста и т.п.) с возможностью публикации в форматах Microsoft Word, Html и др.;
ввода первичной информации, собранной в ходе прикладного исследования;
обработки и анализа этой информации;
представления полученных результатов анализа в виде таблиц, текстов, графиков и диаграмм с возможностью их переноса в форматы Html, Word, Excel и др.
Слайд 41Обучение
https://www.vortex10.ru/study
Слайд 43Другие пакеты статистических программ
Matlab
Mathematica
Mathcad
Maple
STADIA
STATGRAPHICS
PLUS
NCSS
STATA
Цихончик Н.В., 2016
Слайд 44Stata
Пакет Stata – универсальный статистический пакет компании StataCorp7. Первая версия
пакета была выпущена в 1985 г. На сегодняшний день разработана
11-я версия пакета (Stata 11).
Пакет Stata позиционируется как инструмент анализа, предназначенный для специалистов, которые занимаются научными исследованиями. По мнению разработчиков, благодаря гибкой модульной структуре пакет применим для анализа данных из различных областей знаний: общественные науки (экономика, политология и пр.), медицина (биостатистика, эпидемиология и пр.) и т. д.
Цихончик Н.В., 2016
Слайд 46Minitab
Последняя версия Minitab 16 позиционируется разработчиками как статистический пакет для
аналитической работы на современных предприятиях.
Цихончик Н.В., 2016
Слайд 49Домашнее задание
Скачать установочные программы (PSPP) или демо-версии (SPSS / Vortex)
Найти
в собственных архивах 1 – 2 базы числовых данных.