Помощь по математической статистике

Подготовка собранных данных к обработке
Прежде, чем что-то считать, выполните первичную сортировку протоколов:
1. разложите все протоколы по кучкам - одна кучка- один испытуемый. Проследите, чтобы в каждой кучке протоколы следовали в одном и том же порядке.
2. Скрепите все протоколы в каждой кучке степлером или скрепкой.
3. Соберите все получившиеся кучки в одну стопку.
4. На верхнем протоколе каждой кучки напишите индивидуальный номер испытуемого.
Создание сводной таблицы первичных данных
Теперь можете приступать к созданию ЭЛЕКТРОННОЙ БАЗЫ ДАННЫХ. Простейшая база данных - это электронная таблица, например Exel из MSOffiсe, или Calc из OpenOffice. а Еще лучше, если у вас есть возможность воспользоваться пакетами STATISTICA, ИЛИ SPSS. Самое главное - таблица должна быть ОДНА: если вы сравниваете , например, мужчин и женщин, то ни в коем случае не помещайте их данные в разные таблицы! Вместо этого первом столбце расположите индивидуальные регистрационные номера испытуемых, а в одном из последующих столбцов - код, указывающий на его/её ПОЛ. Этот столбец у вас будет служить ГРУППИРУЮЩЕЙ ПЕРЕМЕННОЙ. В остальных столбцах поместите все без исключения данные из протоколов (обычно, это набранные испытуемыми баллы или коды ответов на вопросы анкеты) . Если вы сделаете все верно, то в столбцах вашей таблицы будут располагаться ПЕРЕМЕННЫЕ (Variable), включая социально-демографические данные (один столбец- одна переменная), а встроках - СЛУЧАИ (Case) т.е. испытуемые (одна строка - один испытуемый). После этого, бумажные протоколы вы можете спокойно куда-нибудь спрятать - они вам понадобятся только, если вы вдруг потеряете созданную таблицу...

На основе такой сводной таблицы вам будет гораздо проще выполнить аналитическую работу (анализ данных) вручную, или на компьютере. Кроме того, без сводной таблицы в на психологическом отделении ФСРПиПС ВГПУ вас просто не допустят к защите.

Принципы и правила ввода данных в электронную таблицу вы можете узнать из учебника Боровиков Владимир: STATISTICA: искусство анализа данных на компьютере
прямая ссылка на скачивание книги в архиве (формат djvu, 10мб) .

Когда таблица будет готова, сформулируйте задачи в соответствии с проверяемыми гипотезами, выберите метод решения и произведите вычисления.




Оценка первичных данных, итожащие статистики

Любая шкала, в которой измеряны данные переменной может принадлежать к одной из трёх разновидностей:
  1. количественная, 
  2. порядковая, 
  3. качественная. 
Виды шкал здесь перечислены в порядке убывания их информативности.

Количественные шкалы отражают меру выраженности какого-то признака. Т.е. все испытуемые, получившие по шкале интроверсии 12 баллов - одинаково интровертированы. А испытуемый с 19 баллами интровертированнее получившего 17 баллов на столько же, на сколько получивший 5 баллов интровертированнее получившего 3 балла.
Количественные шкалы называют метрическими, так как при их построении используются некоторые меры, т.е. размеры, принятые в качестве единиц измерений
Количественные шкалы делят на интервальные шкалы, шкалы отношений и шкалы абсолютных величин.
  • Шкала абсолютных величин  отмечает абсолютные количественные значения измеряемого - количество ошибок в корректурной пробе, количество секунд, потраченных на решение тестового задания, количество задач, решенных за час и т.п. - Результаты измерений по шкале абсолютных величин имеют наибольшую достоверность, информативность и чувствительность к неточностям измерений и не накладывает никаких ограничений на математический аппарат, используемый для обработки результатов наблюдений. 
  • Шкала отношений характеризуется тем, что здесь присутствует условно выбранная эталонная единица измерения, например: градус, килограмм, или балл... Особенность этой шкалы - что в ней строго определено положение нулевой точки. Шкала отношений также не накладывает никаких ограничений на математический аппарат, используемый для обработки результатов наблюдений. Можно сказать, что человек весом в 100 кг в два раза тяжелее, чем с весом 50 кг.
  • Шкалы интервалов дают ответ на вопрос «на сколько больше?», но не позволяют утверждать, что одно значение измеренной величины во столько-то раз больше или меньше другого. Например, если температура повысилась с 10 до 20°С, то нельзя сказать, что стало в два раза теплее. Так же нельзя сказать, что человек с 120IQ в два раза умнее, чем с 60IQ, но можно утверждать, что 140IQ больше 110IQ на столько же, на сколько 90IQ больше 70IQ. Это ограничение очень важно при интерпретации полученных результатов.
Для выбора метода проверки статистической гипотезы довольно критичным является закон распределения переменной. Если визуальная оценка гистограммы распределения показывает сильное отклонение от формы Гауссовского распределения - такие итожащие статистики как "среднее" и "стандартное отклонение" - некорректны, не имеют физического смысла.а также основанные на этих мерах критерии проверки статистических гипотез (r Пирсона, t Стьюдента и др.).

Вместо этого, вы должны использовать такие итожащие статистики как минимум, максимум, 25, 50 и 75 квартили а также - непараметрические статистики. Надо также иметь в виду, что во многих случаях при возрастании объема выборки, форма выборочного распределения приближается к нормальной, даже если распределение исследуемых переменных не является нормальным (центральная предельная теорема). Поэтому, имеет смысл заранее позаботиться достаточно большом объеме выборки (>100).
Необходимо также отметить, кто исследования с помощью методов Монте- Карло показали,  что тесты, основанные на предположении нормальности, не так чувствительны к различным нарушениям нормальности чем это первоначально предполагалось. Поэтому, при выборе статистических тестов имеет смысл по возможности предпочитать параметрические критерии.
Для оценки формы распределения в подавляющем большинстве случаев достаточно визуальной оценки гистограммы распределения.


Порядковые шкалы отражают лишь позицию объектов по отношению друг к другу, но не содержат информации о дистанции между этими объектами. Примерами порядковых шкал служат: школьные отметки, место занятое на соревнованиях, социально-экономические классы и профессиональный статус. Порядковые шкалы часто используются для измерения отношения, мнения, восприятия и предпочтения. Оценки экспертов также следует считать измеренными в порядковой шкале. Недостаток порядковой шкалы состоит в том, что все испытуемые, обладающие высоким уровнем нейротизма считаются одинаково нейротичными хотя реальная её выраженность может быть у них разной (от 15 до 20). Второй недостаток этой шкалы в том, что из двух испытуемых один может относиться к высокому уровню (15 баллов), а другой к среднему (14 баллов) при том, что дистанция между ними - всего один балл! Таким образом, порядковая шкала всегда содержит меньше информации, чем количественная и поэтому никогда не следует без достаточных оснований переводить данные из количественной шкалы в порядковую. Это - очень часто встречающаяся ошибка студентов, выполняющих дипломные исследования: вместо сырых баллов по тестовой количественной шкале они используют стандартные тестовые оценки уровня признака (высокий-средний-низкий), тем самым заведомо внося искажения в реальную картину. Не поступайте так, берегите собранную информацию - иначе вы существенно снижаете качество и ценность вашей работы!
Порядковые шкалы можно разделить на две группы: ранговые и уровненвые.
  • Ранговые шкалы могут содержать большое количество градаций (место, занятое на соревнованиях, количество решенных задач без учета их трудности..) По отношению к ранговым шкалам применимы те же непараметрические статистики, что и к метрическим шкалам небольшого объема с распределением отличающимся от нормального. В этом ранговые шкалы приближаются к количественным.
  • Уровненвые шкалы содержат небольшое количество градаций. Например, шкала Лайкерта:  -абсолютно не согласен - не согласен - нейтральное отношение - согласен - полностью согласен. Другой пример: -низкий - средний - высокий уровень выраженности того или иного качества. По отношению к уровневым шкалам невозможно использовать статистики, основанные на рангах потому, что слишком большое количество измерений будут занимать один и тот же ранг. В этом уровненвые шкалы схожи с номинальными.

Номинальные (качественные) шкалы - самые простые из всех шкал. В них числа выполняют роль ярлыков, заменяющих название группы, к которой относится объект.Например - некоторые личностные тесты относят человека к тому или иному типу личности не указывая на сколько этот тип выражен (например, темпераменты: 1-холерик 2-флегматик 3-сангвиник 4-меланхолик). Другой очень распространённый случай номинальной шкалы - вопросы анкеты с готовыми вариантами ответов. При этом номера ответов присваиваются произвольно. Мы не можем считать, что ответ №3 больше, чем ответ №1. Или что темперамент №2 меньше, чем темперамент №4. Номинальные шкалы вообще не содержат информации о выраженности признака.
С величинами, измеряемыми в шкале наименований, можно выполнять только одну операцию -  вычисление  частот встречаемости классов в анализируемой выборке. Это - единственная итожащая статистика допустимая по отношению к номинальным шкалам и основной способ обработки анкетных данных.
На некоторые вопросы респондент может выбрать больше, чем один ответ - это вопросы со множественными выборами. Здесь принцип остаётся неизменным - подсчитывается количество выборов испытуемыми каждой из категорий.
Номинальные шкалы можно разделить на 2 класса:
  • Номинальные шкалы с количеством категорий больше двух. Например: тип личности по MBTI, любимый предмет, № школы; цвет, выбранный для рисования "несуществующего животного" и т.п.
  • Дихотомические шкалы фиксируют лишь наличие или отсутствие у испытуемого какого-то признака при наличии только лишь двух этих вариантов: "орёл" или "решка"; принадлежность к контрольной или экспериментальной группе; пол; справился или не справился с заданием; присутствуют или отсутствуют колючки на рисунке несуществующего животного; поставил или не поставил испытуемый ценность №13 на первое место в тесте Рокича и т.п. Дихотомическая шкала содержит самое минимальное количество информации о каждом испытании - один бит.

Очень важно понять, что шкалу высокого уровня технически можно редуцировать до любой шкалы низкого уровня, но обратная процедура невозможна! Следовательно, такую трансформацию лучше вообще не выполнять без особой на то необходимости, поскольку шкала высокого уровня всегда более точно и тонко описывает изучаемую закономерность и позволяет принять более взвешенное и осторожное решение о связи между переменными.



Анализ связи между переменными
В подавляющем большинстве случаев количественное психологическое исследование направлено на поиск связи между независимой (или несколькими независимыми) переменной, которая называется "фактор" и зависимой (или несколькими зависимыми) переменной, которая называется "отклик". Статистический анализ объясняет вариацию переменной-отклика влиянием фактора. Иными словами, основная задача статистического исследования состоит в том, чтобы проверить: как связана каждая независимая переменная с каждой зависимой переменной. Напоминаю, что зависимая переменная - это всегда объект вашего исследования, а то, как независимые переменные влияют на вариацию объекта исследования - это предмет исследования.
Если вы пользуетесь SPSS 19, то вы можете в редакторе данных заранее пометить каждую переменную как входную (независимую) либо как целевую (зависимую), тогда в соответствии с заложенным алгоритмом программа сможет подобрать необходимые статистические методы и выполнить расчёты связи между переменными в автоматическом режиме.
В некоторых случаях возникает необходимость рассчитать долю влияния сразу же нескольких независимых переменных на вариацию целевой (независимой). В рамках дипломных исследований такие задачи решаются редко, т.к. подразумевают наличие у студента относительно хороших знаний мат.статистики, а на итоговую оценку это влияет не сильно, поскольку подразумевается, что всё-таки оцениваются знания психологии, а не математики.

Для подбора адекватного стат.метода оценки связи следует учитывать большое количество обстоятельств, которые достаточно хорошо изложены в учебниках по мат.статистике (см. раздел "Психологическая литература..."). Здесь я хочу остановиться на двух ведущих критериях, на которые необходимо опираться для такого отбора в первую очередь:
  1. Тип шкал
  2. форма распределения
Как подобрать статистический метод оценки связи между переменными на основе имеющихся шкал

В дипломных исследованиях, направленных на установление связи, обычно решаются две группы задач:
  1. Задачи на установление связи между различными переменными. Например: связь между полом испытуемого и его ценностными ориентациями. Связь между уровнем семейного дохода и социометрическим статусом в группе. Связь между эмоциональностью и интеллектом.
  2. Задачи на установление связи изменения в показателях одной и той же переменной с влиянием какого-либо воздействия. В таком случае показатели до воздействия сравниваются с теми же самыми показателями после воздействияНапример: изменятся ли ответы на один и тот же опросник у одних и тех же испытуемых при повторном тестировании через месяц (повлияло ли время на самовосприятие)? Или: будут ли различными установки целевой аудитории до и после выслушивания аргументов (повлияли ли аргументы на изменение установок)?

1. задача - оценка связи зависимых и независимых переменных
Ниже представлены рекомендации по подбору статистических критериев для переменных  исходя из того, в каких шкалах они измерены.

Рассмотрим семь базовых вариантов сочетаний шкал:
  1. Несколько количественных  Х количественная
  2. Количественная Х количественная
  3. Уровневая (номинальная) Х количественная
  4. Дихотомическая Х количественная
  5. Уровневая (номинальная) Х уровневая (номинальная) 
  6. Дихотомическая Х уровневая (номинальная) 
  7. Дихотомическая Х дихотомическая 


отклик
 фактор
количественная
уровневая или номинальная
дихотомическая
количественная

2.        R Спирмена; 
3.        tau Кендалла;  
·         ANOVA (однофакторный дисперсионный анализ - F критерий Фишера). 
·         Н-тест Крускала и Уоллиса; 
·         Медианный тест.
·      t-критерий Стьюдента для несвязанных выборок.  
·      U Критерий Вилкоксона - Манна-Уитни; 
·      Критерий серий Уалда-Вольфовица; 
·         Тест Мозеса.
уровневая или номинальная
·         Двухвыборочный критерий Колмогорова-Смирнова.
дихотомическая



Для каждого из вариантов сочетаний предназначен свой набор статистических критериев. Если вы будете их знать, то лишь заглянув в сводную таблицу данных вы поймёте, какой метод нужно использовать.
1.Несколько количественных независимых и одна количественных зависимая переменные
Методы   статистической оценки:
2.Две количественные переменные: 
Визуальная оценка связи производится с помощью диаграммы рассеивания
Методы   статистической оценки:
Нормальное распределение
Ненормальное распределение или ранговая шкала
3.Уровневая (или качественная) независимая и количественная зависимая переменные:
Для оценки связи между зависимой и независимой переменной используется группировка данных с помощью категорий. Поэтому в подобных случаях независимая переменная называется группирующей. Группирующая переменная выступает  в качестве "фактора" в то время, как зависимая переменная рассматривается как "отклик".
Визуальная оценка связи между фактором и откликом производится с помощью диаграмм размаха (ящичных диаграмм) 
Методы   статистической оценки:
Нормальное распределение
Ненормальное распределение или ранговая шкала -
4.Дихотомическая независимая и количественная зависимая переменные: 
Для оценки связи между зависимой и независимой переменной используется разделение выборки на две подвыборки с помощью  дихотомической группирующей переменной. Группирующая переменная выступает  в качестве "фактора" в то время, как зависимая переменная рассматривается как "отклик".
Визуальная оценка связи производится с помощью диаграмм размаха (ящичных диаграмм) 
Методы   статистической оценки:
Нормальное распределение - 
Ненормальное распределение или ранговая шкала -
5.Уровневая (или качественная) независимая и уровневая (или качественная) зависимая переменные:
Визуальная оценка связи производится с помощью анализа таблиц сопряженности и графиков
Здесь мы имеем дело с многострочными таблицами, где количество строк равно количеству уровней независимой переменной, а количество столбцов - количеству уровней зависимой переменной.
Методы   статистической оценки:
6.Дихотомическая независимая и уровневая зависимая переменные:
Визуальная оценка связи производится с помощью анализа таблиц сопряженности и графиков
Здесь мы имеем дело с таблицами, где количество строк всегда равно 2, поскольку независимая переменная дихотомическая, а количество столбцов равно количеству уровней зависимой переменной.
Методы   статистической оценки:
7. Дихотомическая независимая и дихотомическая зависимая переменные 2Х2 :
Визуальная оценка связи производится с помощью анализа таблиц сопряженности 2х2 и графиков
Здесь мы имеем дело с таблицами, которые обычно обозначаются 2Х2. И количество строк, и количество столбцов в таких таблицах равно двум, поскольку обе переменные дихотомические:


Вторая группа задач - оценка изменений оценок в одной и той же выборке до и после воздействия. 
Рассматривается три базовых варианта оценок в зависимости от использованных шкал.




два повторных измерения
больше двух повторных измерений
Количественная шкала
·          Критерий знаков
·          L — Пейджа; 
·          W Кендала.
Номинальная шкала
·          Хи-квадрат
·           
Дихотомическая шкала
·          Q Кохрана


1.Количественная шкала:
Визуальная оценка различий характеристик распределения до и после воздействия производится с помощью анализа диаграмм размаха (ящичных диаграмм) 


Нормальное распределение -

Ненормальное распределение или ранговая шкала -
2.Номинальная шкала:
3.Дихотомическая шкала:
Визуальная оценка связи производится с помощью анализа таблиц сопряженности 2х2 и графиков
Если производится больше двух повторных измерений (воздействий):

1.Количественная шкала (нормальное распределение):
Нормальное распределение - 

Ненормальное распределение или ранговая шкала - 
2.дихотомическая шкала: 




На сайте StatSoft находится "Советник" по статистике для медицинских исследований. Это специально разработанная программа, позволяющая неподготовленному пользователю (врачу, студенту, аспиранту, докторанту) ориентироваться в разнообразных статистических методах, реализованных в системе STATISTICA. Последовательно ответьте на вопросы "советника" и он предложит вам нужную процедуру обработки данных. Запустить электронный советник.

Комментариев нет: