Создание таблиц сопряженности
Загрузите файл studium.sav.
Для создания таблиц сопряженности и вычисления меры связанности на их основе, выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ►
Crosstabs... (Таблицы сопряженности). Откроется диалоговое окно Crosstabs (см. рис. 11.1).
Рис. 11.1: Диалоговое окно Crosstabs (Таблицы cопряженности)
Список исходных переменных содержит переменные открытого файла данных. Здесь можно выбрать переменные для строк и столбцов таблицы сопряженности. Для каждого сочетания двух переменных
будет создана таблица сопряженности. Например, если в списке строк (Rows) находится три переменных, а в списке столбцов (Columns) — две, то мы получим 3 x 2 = 6 таблиц сопряженности.
Сначала мы построим таблицу сопряженности из переменных sex (пол) и psyche (психическое состояние). Поступите следующим образом:
Перенесите переменную sex в список строк (Rows), а переменную psyche — в список столбцов (Columns).
Щелкните на ОК, и будет создана таблица сопряженности в стандартном формате. В окне просмотра будут показаны следующие таблицы:
Case Processing Summary (Обработанные наблюдения)
|
Cases (Случаи) |
Valid (Допустимые) |
Missing (Отсутствующие) |
Total (Всего) |
|
N |
Percent |
N |
Percent |
N |
Percent |
Пол * Психическое состояние |
106 |
98,1% |
2 |
1,9% |
108 |
100,0% |
Пол * Психическое состояние Crosstabulation (Таблица сопряженности)
Count (Число)
|
Психическое состояние |
Total |
|
|
Крайне неустойчивое |
Неустойчивое |
Устойчивое |
Очень устойчивое |
Пол |
Женский |
16 |
18 |
9 |
1 |
44 |
Мужской |
3 |
22 |
32 |
5 |
62 |
Total |
|
19 |
40 |
41 |
6 |
106 |
Первая таблица содержит информацию о числе самих наблюдений; два наблюдения содержат пропущенные значения по крайней мере в одной из двух участвующих переменных. Вторая таблица — это собственно
таблица сопряженности. Переменная "Психическое состояние" (psyche) является столбцовой переменной, так как каждое ее значение (крайне неустойчивое, устойчивое, ...) отображается в отдельном столбце.
Переменная "Пол" (sex) — это переменная строк, так как каждое ее значение (женский, мужской) отображается в отдельной строке таблицы. Значение в каждой ячейке таблицы — количество наблюдений (частота).
Так, например, 16 респонденток оценивают свое психическое состояние как "крайне неустойчивое", а 5 респондентов-мужчин — как "очень устойчивое". Если для таблицы сопряженности приняты параметры
по умолчанию, в каждой ячейке отображается только абсолютная частота. Метки переменных и значений в таблице соответствуют определениям переменных в файле данных SPSS.
Числа в последней строке и в последнем столбце (Total) показывают суммы значений соответственно по строкам и столбцам. В данном примере суммы по строкам указывают,
что 44 (16+18+9+1) опрошенных — лица женского пола, а 62 — мужского. Суммы по столбцам показывают, что 19 опрошенных (16 + 3) оценивают свое психическое состояние как "крайне неустойчивое",
40 как неустойчивое, 41 как устойчивое и 6 как "Очень устойчивое". При анализе принимались в расчет 106 допустимых наблюдений. Полученные результаты мы можем интерпретировать следующим образом:
Из 106 опрошенных, которые учитывались при анализе, — 44 женщины и 62 мужчины.
16 женщин оценивают свою психику как "крайне неустойчивую", тогда как для мужчин это количество составляет только 3.
Лишь одна женщина считает свое психическое состояние "очень устойчивым", а мужчин с таким состоянием пятеро.
Даже первое впечатление, которое возникает при анализе таблицы сопряженности, свидетельствует о том, что зависимость между переменными Пол и Психическое состояние существует.
Женщины считают свое психическое состояние более неустойчивым, чем мужчины. Исследуем эту зависимость чуть более детально; для этого нам понадобится точно ответить на следующие вопросы:
Существует ли зависимость вообще?
Что можно сказать об интенсивности этой зависимости?
Что можно сказать о направлении и характере этой зависимости?
Более тщательно исследовать существование зависимости позволяет вычисление значений ожидаемых частот. Чтобы определить эти значения, выполните следующие действия:
Выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs... (Таблицы сопряженности).
В списке строк у нас должна стоять переменная sex, а в списке столбцов — переменная psyche.
Щелкните на кнопке Cells... (Ячейки). Откроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отображение ячеек).
По умолчанию в ячейках таблицы сопряженности отображаются только наблюдаемые значения частот (Observed). В группе Counts (Частоты) можно выбрать один или более следующих вариантов отображения:
Observed (Наблюдаемые): Будут отображаться наблюдаемые частоты. Это настройка по умолчанию.
Expected (Ожидаемые): Если установить этот флажок, будут отображаться ожидаемые частоты. Они вычисляются как произведение сумм соответствующей строки и столбца,
деленное на общую сумму частот. Например, ожидаемая частота для женщин с "крайне неустойчивым" психическим состоянием 7,9 = (16 + 18 + 9 + 1) x (16 + 3) / 106.
Рис. 11.2: Диалоговое окно Crosstabs: Cell Display
Установите флажок Expected.
Щелкните на кнопке Continue, а затем на ОК. Вы получите следующую таблицу сопряженности.
Пол * Психическое состояние Crosstabulation (Таблица сопряженности)
|
Психическое состояние |
Total |
|
Крайне неустойчивое |
Неустойчивое |
Устойчивое |
Очень устойчивое |
Пол |
Женский |
Count |
16 |
18 |
9 |
1 |
44 |
|
Expected Count (Ожидаемое кол-во) |
7,9 |
16,6 |
17,0 |
2,5 |
44,0 |
|
Мужской |
Count |
3 |
22 |
32 |
5 |
62 |
|
Expected Count |
11,1 |
23,4 |
24,0 |
3,5 |
62,0 |
Total |
Count |
19 |
40 |
41 |
6 |
106 |
Expected Count |
19,0 |
40,0 |
41,0 |
6,0 |
106,0 |
Теперь под наблюдаемыми частотами (Count) появились ожидаемые значения Expected Count). Эти данные мы можем интерпретировать так:
Для значений переменной Психическое состояние "крайне неустойчивое" и "неустойчивое" абсолютная частота у опрашиваемых женщин выше, чем ожидаемая (16 и 7,9; 18 и 16,6),
тогда как при значениях "устойчивое" и "очень устойчивое" она ниже (9 и 17.0; 1 и 2,5).
У опрашиваемых мужчин мы находим противоположную тенденцию. Для значений "крайне неустойчивое" и "неустойчивое" абсолютная частота ниже, чем ожидаемая (3 и 11,1; 22 и 23,4),
тогда как для значений "устойчивое" и "очень устойчивое" она выше 32 и 24,0; 5 и 3,5). Эти результаты мы можем объединить в следующую таблицу:
|
Крайне неустойчивое; неустойчивое |
Очень устойчивое; устойчивое |
Женщины |
Абс. частота > ожидаемой частоты |
Абс. частота < ожидаемой частоты |
Мужщины |
Абс. частота < ожидаемой частоты |
Абс. частота > ожидаемой частоты |
Таким образом, первоначальное впечатление, что женщины считают свое психическое состояние менее устойчивым, чем мужчины, подтверждается. Еще одну возможность выявления существования
зависимости между переменными дает вычисление остатков. Эти остатки являются показателем того, насколько сильно наблюдаемые и ожидаемые частоты отклоняются друг от друга.
Чтобы получить остатки частот, необходимо выполнить следующие действия:
Выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs... (Таблицы сопряженности).
В списке переменных строк должна была стоять переменная sex, а в списке переменных столбцов — переменная psyche.
Щелкните на кнопке Cells... Флажки Observed и Expected следует оставить помеченными. В группе Residuals (Остатки) можно выбрать один или более следующих вариантов отображения:
Unstandardized (Ненормированные): Отображаются ненормированные остатки, то есть разность наблюдаемых (fo) и ожидаемых (fe) частот.
Standardized (Нормированные): Отображаются нормированные остатки. Для этого ненормированные остатки делятся на квадратный корень из ожидаемой частоты.
Нормированные остатки полезны при последующем проведении анализа тестов по критерию X2.
Adjusted standardized (Уточненные нормированные): Нормированные остатки представляют собой отклонение наблюдаемой частоты от ожидаемой, измеренное в числе стандартных отклонений.
Вычисляются с учетом сумм по строкам и столбцам:
Где z — сумма по текущей строке, a s — сумма по текущему столбцу; N — общая сумма частот.
Установите флажок Unstandardized.
Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК. Вы получите следующую таблицу сопряженности.
Пол * Психическое состояние Таблица сопряженности
|
Психическое состояние |
Total |
|
Крайне неустойчивое |
Неустойчивое |
Устойчивое |
Очень устойчивое |
Пол |
Женский |
Count |
16 |
18 |
9 |
1 |
44 |
Expected Count |
7,9 |
16,6 |
17,0 |
2,5 |
44,0 |
Residual (Остаток) |
8,1 |
1,4 |
-8,0 |
-1,5 |
|
Мужской |
Count |
3 |
22 |
32 |
5 |
62 |
Expected Count |
11,1 |
23,4 |
24,0 |
3,5 |
62,0 |
Residual |
-8,1 |
-1,4 |
8,0 |
1,5 |
|
Total |
|
Count |
19 |
40 |
41 |
6 |
106 |
Expected Count |
19,0 |
40,0 |
41,0 |
6,0 |
106,0 |
Можно заметить, что каждый остаток равен разности наблюдаемой и теоретически ожидаемой частот в данной ячейке (например, в первой ячейке 16 - 7,9 = 8,1). Остатки делают еще более
заметной противоположную тенденцию самооценки у мужчин и женщин.
Таблицы сопряженности, которые мы рассмотрели выше, имеют тот недостаток, что в них приводятся только абсолютные значения. Чтобы узнать, насколько эти значения
важны по отношению к общему количеству, надо определить их процентную долю
для вычисления процентных значений выполните следующие действия:
Выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs... (Таблицы сопряженности)
Не изменяя прежних настроек, щелкните на кнопке Cells... Откроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отображение ячеек).
В группе Percentages (Проценты) можно выбрать один или более из нижеследующих вариантов отображения:
Row (По строкам): Вычисляются процентные значения по строкам: количество наблюдений в каждой ячейке, отнесенное к сумме по строке.
Column (По столбцам): Вычисляются процентные значения по столбцам: количество наблюдений в каждой ячейке в отношении к сумме столбца.
Total (Полные): Вычисляются полные процентные значения: количество наблюдений в каждой ячейке, отнесенное к общей сумме наблюдений.
Установите флажки Row, Column и Total.
Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК. В окне просмотра результатов будет получена таблица сопряженности, приведенная ниже.
Пол * Психическое состояние Таблица сопряженности
|
Психическое состояние |
Total |
|
Крайне неустойчивое |
Неустойчивое |
Устойчивое |
Очень устойчивое |
Пол |
Женский |
Count |
16 |
18 |
9 |
1 |
44 |
Expected Count |
7,9 |
16,6 |
17,0 |
2,5 |
44,0 |
% от Пол |
36,4% |
40,9% |
20,5% |
2,3% |
100,0% |
% от Психическое состояние |
84,2% |
45,0% |
22,0% |
16,7% |
41,5% |
% of Total |
15,1% |
17,0% |
8,5% |
0,9% |
41.5% |
Residual |
8,1 |
1,4 |
-8,0 |
-1.5 |
|
Мужской |
Count |
3 |
22 |
32 |
5 |
62 |
Expected Count |
11,1 |
23,4 |
24,0 |
3,5 |
62,0 |
% от Пол |
4,8% |
35,5% |
51,6% |
8.1% |
100,0% |
% от Психическое состояние |
15,8% |
55,0% |
78,0% |
83,3% |
56,5% |
% of Total |
2,8% |
20,8% |
30,2% |
4,7% |
58,5% |
Residual |
-8,1 |
-1,4 |
8,0 |
1,5 |
|
Тotal |
Count |
19 |
40 |
41 |
6 |
106 |
Expected Count |
19,0 |
40,0 |
41,0 |
6,0 |
106,0 |
% от Пол |
17,9% |
37,7% |
38,7% |
5,7% |
100.0% |
% от Психическое состояние |
100,0% |
100,0% |
100,0% |
100,0% |
100,0% |
% of Total |
17,9% |
37,7% |
38,7% |
5,7% |
100,0% |
В таблице дополнительно отображаются процентные значения частот по отношению к суммам строк, столбцов и общей сумме.
Возьмем для примера первую ячейку. Значения, содержащиеся в ней можно интерпретировать следующим образом:
16 из 44 женщин-респонденток или 36,4% от общего числа опрашиваемых охарактеризовали свое психическое состояние как "крайне неустойчивое".
Из 19 респондентов с "крайне неустойчивым" состоянием 16 — женщины, что составляет 84,2%.
16 женщин-респонденток дали ответ "крайне неустойчивое", что по отношению ко всей таблице (общему количеству респондентов) составляет 15,1%.
Можно также сделать следующие общие выводы:
36,4% женщин оценивают свою психику как "крайне неустойчивую", тогда как среди мужчин эта доля составляет только 4,8%.
Среди опрашиваемых, оценивающих свою психику как "крайне неустойчивую", женщины составляют 84,2%, а мужчины — лишь 15,8%.
77,3% (36,4% + 40,9%) женщин считают свое психическое состояние "крайне неустойчивым" или "неустойчивым", в то время, как только 40,3% (4,8% + 35,5%) мужчин дают такую же оценку своего психического состояния.
22,8% (20,5% + 2,3%) женщин и 59,7% (51,6% + 8,1%) мужчин оценивают свою психику как "устойчивую" или "очень устойчивую".
2,3% женщин оценивают свое психическое состояние как "очень устойчивое", а среди мужчин эта доля составляет 8,1%.
Среди опрашиваемых, оценивающих свою психику как "очень устойчивую", женщины составляют 16,7%, а мужчины — 83,3%.
На вопрос, существует ли зависимость между переменными sex и psyche, наиболее ясный ответ в данном примере дают процентные частоты по столбцам. Эти частоты сведены в следующую таблицу:
|
Крайне неустойчивое |
Неустойчивое |
Устойчивое |
Очень устойчивое |
Женский |
84,2 |
45,0 |
22,0 |
16,7 |
Мужской |
15,8 |
55,0 |
78,0 |
83,3 |
Так как в нашем случае процентные распределения значительно различаются, мы могли сделать вывод о существовании статистической зависимости между признаками sex и psyche.
Значительно больше женщин, чем мужчин, оценивают свое психическое состояние как "крайне неустойчивое", и значительно больше мужчин, чем женщин, оценивают свое психическое состояние как "очень устойчивое".
Таким образом, наблюдается различие в оценках психического состояния, связанное с полом. Является ли это различие значимым, можно выяснить при помощи
хи-квадрат-теста.
Форматы таблиц сопряженности
Можно изменить порядок сортировки переменных строк в таблице сопряженности, щелкнув в диалоговом окне Crosstabs на кнопке Formal... (Формат).
Откроется диалоговое окно Crosstabs: Table Format (Таблицы сопряженности: Формат таблицы).
В группе Row Order (Порядок строк) можно выбрать один из следующих вариантов сортировки значений:
Ascending (По возрастанию): Значения переменных строк отображаются в порядке возрастания от наименьшего к наибольшему. Это настройка по умолчанию.
Descending (По убыванию): Значения переменных строк отображаются в порядке убывания от наибольшего к наименьшему.
Рис. 11.3: Диалоговое окно Crosstabs: Table Format
Применение переменных групп и слоев
Созданные выше таблицы сопряженности можно разделить по специальностям. Вполне может быть, что переменная fach (Специальность) оказывает влияние на зависимость между sex и psyche.
Чтобы выявить возможные различия, следует создать отдельные таблицы, в нашем случае — по одной таблице для каждой специальности. Такие таблицы могут выявить интересные различия между
отдельными специальностями. В рассматриваемом примере переменная fach играет роль переменной слоев. Анализ производится по группам, то есть для каждой группы — в нашем случае для каждой
специальности — составляется отдельная таблица сопряженности.
Чтобы задать переменную слоев, поступите так:
Выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs... (Таблица сопряженности). В списке строк у нас должна стоять переменная sex, а в списке столбцов — переменная psyche.
Перенесите переменную fach в список переменных слоев. В диалоговом окне это третий сверху список; он еще пуст. Диалоговое окно Crosstabs приобретет вид, показанный на рис. 11.4.
Рис. 11.4: Заполненное диалоговое окно Crosstabs
Можно выбрать другие уровни переменных слоев. Для каждой категории каждой из переменной слоев будет создана отдельная таблица сопряженности. Чтобы добавить новый слой,
щелкните на кнопке Next (Следующий). Каждый последующий уровень делит таблицу сопряженности на меньшие подгруппы. Переходить от одного слоя к другому можно при помощи кнопок Next и Previous (Предыдущий).
|