9.1. Описательная статистика
В качестве примера рассмотрим исследование, относящееся к области медицины — анализ действия двух различных лекарств (с вымышленными названиями альфасан и бетасан)
на снижение кровяного давления у гипертоников. Эти данные хранятся в файле hyper.sav, содержащем 174 наблюдения и значения следующих переменных:
nr |
Номер пациента |
med |
Лекарство (1 = альфасан, 2 = бетасан) |
g |
Пол (1 = мужской, 2 = женский) |
a |
Возраст, лет |
gr |
Рост, см |
gew |
Вес, кг |
rrs0 |
Систолическое кровяное давление, исходное значение |
rrs1 |
Систолическое кровяное давление, через 1 месяц |
rrs6 |
Систолическое кровяное давление, через 6 месяцев |
rrs12 |
Систолическое кровяное давление, через 12 месяцев |
rrd0 |
Диастолическое кровяное давление, исходное значение |
rrd1 |
Диастолическое кровяное давление, через 1 месяц |
rrd6 |
Диастолическое кровяное давление, через 6 месяцев |
rrd12 |
Диастолическое кровяное давление, через 12 месяцев |
chol0 |
Холестерин, исходное значение |
chol1 |
Холестерин, через 1 месяц |
chol6 |
Холестерин, через 6 месяцев |
chol12 |
Холестерин, через 12 месяцев |
bz0 |
Сахар в крови, исходное значение |
bz1 |
Сахар в крови, через 1 месяц |
bz6 |
Сахар в крови, через 6 месяцев |
bz12 |
Сахар в крови, через 12 месяцев |
ak |
Возраст (1 = до 55 лет, 2 = 56-65 лет, 3 = 66-75 лет, 4 = более 75 лет) |
Для ознакомления с характеристиками описательной статистики рассмотрим переменную а, отражающую возраст.
Рис. 9.1: Диалоговое окно Descriptives
Перенесите переменную а в список тестируемых переменных, и щелкните на кнопке Options... (Параметры). Здесь можно задать вычисление следующих статистических характеристик:
Среднего значения,
Суммы,
Стандартного отклонения,
Стандартной ошибки,
Дисперсии,
Минимума,
Максимума,
Размаха,
Эксцесса (вариации),
Асимметрии.
Установите флажки для вывода следующих характеристик: Mean (Среднее значение), Minimum (Минимум), Maximum (Максимум) и S.E. mean (Стандартная ошибка).
Если анализируется несколько переменных, можно также задать последовательность вывода:
в порядке возрастания средних значений,
в порядке убывания средних значений,
по алфавиту (по именам переменных),
согласно списку выбранных целевых переменных.
По умолчанию выбран последний вариант. Если имеется только одна переменная, как в данном примере, порядок не имеет значения.
Пометив желаемые характеристики, щелкните на кнопке Continue... (Далее). В главном диалоговом окне укажите, чтобы стандартизованные значения были сохранены в новой переменной открытого
файла данных, для чего установите флажок Save standardized values as variables.
Запустите вычисление, щелкнув на кнопке ОК. Результат будет показан в окне просмотра:
Descriptive Statistics (Описательная статистика)
|
N |
Minimum |
Maximum |
Mean |
Statistic |
Statistic |
Statistic |
Statistic |
Std. Error |
Statistic |
Возраст |
174 |
36 |
87 |
62,11 |
,88 |
Valid N (listvise) (Допустимых значений (по списку)) |
174 |
|
|
|
|
О значении отдельных характеристик описательной статистики можно прочесть в главе 6.
Видно, что в файле данных появилась новая переменная za. Она содержит нормированные значения переменной а (Возраст). По умолчанию к имени исходной переменной спереди дописывается буква z.
При этом стандартизация (z-преобразование) значения х выполняется по формуле:
где m — среднее значение переменной, a s — стандартное отклонение.
Проведение стандартизации переменных может быть целесообразным при использовании некоторых статистических методов. Его также можно выполнять в тех случаях, когда несколько переменных,
которые имеют различный размах или отличаются на порядки по значению, должны быть приведены к общему показателю. В подобной ситуации сначала необходимо провести стандартизацию этих переменных,
а затем, путем усреднения, вывести общее значение из полученных стандартизованых значений (z-значений).
|