Сравнение двух независимых выборок
В этом разделе описано четыре теста. Наиболее часто применяемым является U-тест Манна и Уитни, который поэтому и будет представлен в первую очередь.
14.1. U-тест по методу Манна и Уитни
Это самый известный и самый распространенный тест непараметрического сравнения двух независимых выборок. Он основан на использовании одной общей последовательности значений обоих выборок.
Мы хотим проверить, отличаются ли показатели сахара в крови для мужчин и женщин в примере об исследовании гипертонии (файл hyper.sav).
Если построить гистограмму показателя сахара в крови (переменная bz0), то заметите явную деформацию распределения в левую сторону.
Тест Колмогорова-Смирнова также показывает очень значительное отклонение от нормального распределения (Asymp. Sig. = 0,000).
Стало быть, для сравнения обоих выборок следует вместо t-теста Стьюдента применить U-тест по методу Манна и Уитни.

Рис. 14.1: Диалоговое окно Two Independent Samples Tests (Тесты для двух независимых выборок)
U-тест по методу Манна и Уитни является предварительной установкой.
Перенесите переменную bz0 из поля исходных переменных в поле тестируемых переменных (Test Variable List), а переменную g в поле групповых переменных (Grouping Variable).
После щелчка на кнопке Define Groups (Определить группы). Вы получите возможность внести коды (1 — мужской и 2 — женский), необходимые для идентификации групп.
После щелчка на Continue опять попадаете в исходное диалоговое окно.
Запустите программу вычисления путём нажатия на ОК.
В окне просмотра появятся следующие результаты:
Ранги
|
Пол |
N |
Mean Rank (Усреднённый ранг) |
Sum of Ranks (Ранговая сумма) |
Blutzucker, Ausgangswert (Сахар, исходное значение) |
Maennlich (Мужской) |
59 |
81,66 |
4818,00 |
Weiblich (Женский) |
115 |
90,50 |
10407,00 |
Total (Сумма) |
174 |
|
|
Статистика тестаа
|
Blutzucker, Ausgangswert (Сахар, исходное значение) |
Mann-Whitney U (U-тест по Манну и Уитни) |
3048,000 |
Wilcoxon W |
4818,000 |
Z |
-1,096 |
Asymp. Sig. (2-tailed) Асимптотическая значимость (2-сторонняя) |
,273 |
a Grouping Variable: Geschlecht (Групповая переменная: пол).
Выведенные результаты включают следующие показатели:
количество наблюдений, усреднённые ранги и ранговая сумма для двух выборок (причём большим значениям присваиваются низшие ранговые места);
тестовую величину U, определенную с помощью теста Манна и Уитни;
наименьшее значение из обоих ранговых сумм (W-тест Уилкоксона);
точное значение вероятности ошибки р при количестве наблюдений менее 30 и
тестовую величину z, определенную по тесту Колмогорова-Смирнова, а также относящуюся к ней вероятность ошибки р, которую следует использовать при количестве наблюдений более 30.
Выясняется, что в рассматриваемом примере разница показателей сахара в крови между полами не является статистически значимой (р = 0,273).
Нажав кнопку Options, можно выбрать дополнительные возможности вывода данных, относящихся к рассмотренному и к другим непараметрическим тестам. Наряду с обычной обработкой пропущенных значений,
можно организовать расчет дескриптивных статистик (среднее значение, минимум, максимум, стандартное отклонение, количество наблюдений) и квартилей (25, 50 и 75 процентили).
Однако в этом случае характеристики дескриптивной статистики будут определяться одновременно для тестируемых и группирующих переменных. Это абсолютно бесполезно,
так как в данном случае дескриптивная статистика имеет смысл только для тестируемых переменных, разбитых на группы по группирующим переменным.
В рассмотренном примере проведения U-теста был бы также очень полезен расчет медиан обеих групп. Медианы определяются с помощью других средств SPSS.
В нашем примере медиана показателя сахара для мужчин равна 93, а для женщин 97.
|