14.6 Отдельный тест по критерию хи-квадрат
С помощью этого теста проверяют, насколько значительно отличаются друг от друга наблюдаемые и ожидаемые частоты переменных, относящихся к номинальной шкале. Как правило, при этом ожидаемая частота подчиняется равномерному распределения; однако в SPSS существует возможность задать соответствующие пропорции.
Одним из примеров ожидаемого равномерного распределения частот являются кости. Предположим, Вы бросили один игральную кость 3000 раз и получили следующее частоты для выпавших очков.
Число очков
|
Частота
|
Число очков
|
Частота
|
1
|
511
|
4
|
498
|
2
|
472
|
5
|
513
|
3
|
572
|
6
|
434
|
Исходя из предположения об идеальности игральную кость (равной вероятности выпадения любого числа очков), ожидаемая частота для каждого из выпавших чисел составит 3000 / 6 = 500. Необходимо проверить, значимо ли отличаются наблюдаемые частоты от ожидаемых. Данные, а именно переменные augen (число очков) и
n (частота), находятся в файле wuerfel.sav. Последнюю переменную следует применить в качестве весовой переменной.
-
Откройте файл wuerfel.sav.
-
Сначала выберите в меню Data (Данные)
Weight Case (Взвесить наблюдения)
-
Переменную
n объявите частотной (см. гл. 8.7), выберите в меню Analyze (Анализ)
Nonparametric Tests (Непараметрические тесты) Chi-Square (Хи-квадрат) Откроется диалоговое окно Chi-Square Test (Тест хи-квадрат) (см. рис. 14.6).
-
Перенесите переменную augen в поле тестируемых переменных.
Если Вы, как в рассматриваемом примере, хотите подвергнуть анализу все категории тестируемых переменных, то оставьте в разделе Expected range (Ожидаемый диапазон) включённой опцию Get from Data (Из исходных данных); в противном случае у
Вас есть возможность ограничить вовлекаемые категории посредством ввода нижней и верхней границ. Так как ожидаемые частоты одинаковы для всех категорий (была принята гипотеза о равномерном распределении), то эта предварительная установка остаётся в силе.
После нажатия кнопки Опции... у Вас появится возможность организовать вывод характеристик дескриптивной статистики и квартилей (что в данном случае является абсолютно бессмысленным).
-
Запустите расчёт путём нажатия ОК.
В окне просмотра появятся следующие результаты:
Augenzahl (Число очков)
|
Observed N (Наблюдаемое N)
|
Expected N (Ожидаемое N)
|
Residuals (остатки)
|
1
|
511
|
500,0
|
11,0
|
2
|
472
|
500,0
|
-28,0
|
3
|
572
|
500,0
|
72,0
|
4
|
498
|
500,0
|
-2,0
|
5
|
513
|
500,0
|
13,0
|
6
|
434
|
500,0
|
-66,0
|
Total (Сумма)
|
3000
|
|
|
Test Statistics (Статистика теста)
|
Augenzahl (Число)
|
Chi-Square (Хи-квадрат) а
|
21,236
|
Df
|
5
|
Asymp. Sig. (Статистическая значимость)
|
,001
|
a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 500,0. (В
0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 500,0.)
Получилось очень значимое значение критерия хи-квадрат (р = 0,001). В рассматриваемом случае желателен вывод не абсолютных, а стандартизированных остатков, определяемых по формуле:
Рис. 14.6: Диалоговое окно СЫ-Square Test (Хи-квадрат-тест)
(см. гл. 11.1). При помощи основополагающего правила, приведенного в главе 8.7.2, можно точно определить те категории, для которых наблюдается значительное отклонение наблюдаемых частот от ожидаемых:
Стандартизированные остатки >= 2,0 указывают на значительное, >= 2,6 на очень значительное и >= 3,3 на сверх значительное отклонение. Если следовать этому правилу, то в экспериментах с игральной костью наблюдается очень значимое превышение количества выпадений 3 очков и очень, очень значимое занижение количества выпадений 6 очков.
Во втором примере, который принадлежит к области ботаники, нужно проверить не равномерное распределение, а наличие распределения подчиняющегося заданному соотношению.
Потомки трёх сортов бобовой культуры были разделены на три типа, которые находятся в соотношении между собой как 1:2:1. Во время некоторого эксперимента, проведенного с сотней таких потомков тип 1 появился 29 раз, тип 2 — 44 раза и тип 3 — 27 раз. Необходимо исследовать значительно ли отклоняется полученное распределение от теоретического распределения 1:2:1.
Данные находятся в файле bohnen.sav, причём переменная typ соответствует типу, а переменная
n частоте.
-
Откройте файл bohnen.sav.
-
Сначала действуйте так же, как в первом примере, и взвесьте наблюдения с частотной переменной
n.
-
В диалоговом окне Chi-Square Test (тест Хи-квадрат) присвойте переменной typ статус тестируемой переменной.
-
В поле Expected values (Ожидаемые значения) активируйте в этот раз опцию Values (Значения). Введите числа 1, 2 и 1 в предусмотренное для этого поле, и щёлкните дополнительно на кнопке Add (Добавить).
-
Запустите расчёт путём нажатия ОК. В окне просмотра появятся следующие результаты:
Тур (Тип)
|
Observed N (Наблюдаемое N)
|
Expected N (Ожидаемое N )
|
Residual (Остаток)
|
1
|
29
|
25,0
|
4,0
|
2
|
44
|
50,0
|
-6,0
|
3
|
27
|
25,0
|
2,0
|
Total (Сумма)
|
100
|
|
|
Test Statistics (Статистика теста)
|
Тур (Тип)
|
Chi-Square (Хи-квадрат) а
|
1,520
|
Of
|
2
|
Asymp. Sig. (Статистическая значимость)
|
,468
|
а. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 25,0. (В
0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 25,0.)
Ожидаемые частоты выстроены в соответствии с заданным соотношением. На сей раз значимого отклонения наблюдаемых частот от ожидаемых не наблюдается (р = 0,468).