Задачи статистики в пакете SPSS

         

7.4 Разделение наблюдений на группы

В SPSS можно выполнять анализ данных раздельно по группам. Группой в этом контексте называется определенное количество наблюдений с одинаковыми значениями признаков. Чтобы можно было производить обработку по группам, файл должен быть отсортирован по группирующим переменным. Такой переменной может быть, например, переменная sex. В этом случае все переменные со значением признака 1 (женский) образуют одну группу, а все переменные со значением признака 2 (мужской) — другую группу. С каждой группой можно проводить определенные операции, например, выполнять частотный анализ. При этом частотный анализ проводится раздельно для признаков мужской и женский. В SPSS такое разделение на группы можно выполнять автоматически. Рассмотрим следующий пример, основанный на опросе студентов об их психическом состоянии и социальном положении:

Проведем частотный анализ переменной psyche (психическое состояние) раздельно для всех изучаемых специальностей. В соответствии со значениями переменной fach (специальность) у нас образуются 9 групп (1 = Юриспруденция, 2 = Экономика, 3 = Гуманитарные науки, 4 = Психология и т.д.). В этом случае файл данных studium.sav должен быть сначала отсортирован по переменной fach. Поступите следующим образом:

  •  Загрузите файл studium.sav в редактор данных.
  •  Выберите в меню команды Data (Данные) Split File... (Разделить файл) Откроется диалоговое окно Split File.


Рис. 7.7: Диалоговое окно Split File

По умолчанию разделение на группы не предполагается. Если выбрать пункт Organize output by groups (Разделить вывод на группы), мы получим вывод результатов по каждой группе отдельно. Эти группы должны быть определены в поле Groups based on (Группы, созданные на основе) на базе соответствующих переменных.

Еще одну возможность предоставляет опция Compare Groups (Сравнить группы). Она организует вывод таким образом, что можно визуально сравнить разные группы друг с другом. Но сначала мы рассмотрим раздельный вывод.

  •  Выберите опцию Organize output by groups. Для раздельного выполнения операций по группам необходимо, чтобы файл данных был предварительно отсортирован по этим группирующим переменным. По этой причине опция Sort the file by grouping variables (Сортировать файл по группирующим переменным) выбрана по умолчанию.
  •  Перенесите переменную fach в поле Groups based on. Если выбирается несколько группирующих переменных, то последовательность, в которой они стоят в списке, определяет порядок или приоритет сортировки.
  •  Щелкните на кнопке ОК. Файл studium.sav будет отсортирован по переменной fach, то есть разбит на группы в соответствии с ее значениями. Сообщение File split on (Разделение файла включено) в строке состояния внизу окна SPSS информирует об активации режиме разделения.
  •  Выполните частотный анализ переменной psyche.
Вы получите следующий результат (ниже для экономии места показаны частотные таблицы только для специальностей Юриспруденция и Естественные науки).

Специальность = Юриспруденция

Статистика(а)

Психическое состояние

N Valid

 Missing

22

0

а. Специальность = Юриспруденция

Психическое состояние(а)

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

Крайне неустойчивое

2

9,1

9,1

9,1

Неустойчивое

5

22,7

22,7

31,8

Устойчивое

12

54,5

54,5

86,4

Очень устойчивое

3

13,6

13,6

100,0

Total  22 100,0 100,0
Спциальность = юриспруденция

Специальность = Естественные науки

Статистика(а)

N Valid 

Missing

18

1

а. Специальность = Естественные науки

Психическое состояние(а)

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

Крайне неустойчивое

1

5,3

5,6

5,6

Неустойчивое

4

21,1

22,2

27,8

Устойчивое

11

57,9

61,1

88.9

Очень устойчивое

2

10,5

11,1

100,0

Всего

18

94,7

100,0

Missing

нет данных

1

5,3

Всего

19

100,0

а. Специальность = Естественные науки

Как видно, результаты частотного анализа переменной psyche выводятся раздельно по специальностям студентов.

  •  Теперь выберите другой пункт — Compare groups (Сравнить группы).
  •  Снова выполните частотный анализ переменной psyche. Вы получите следующую результирующую таблицу:

Психическое состояние

Специальность Frequency Percent Valid Percent Cumulative Percent
Юриспру- денция Valid Крайне неустойчивое 2 9,1 9,1 9,1
Неустойчивое 5 22,7 22,7 31,8
Устойчивое 12 54,5 54,5 86,4
Очень устойчивое 3 13,6 13,6 100,0
Всего 22 100,0 100,0
Экономика Valid Крайне неустойчивое 1 5,3 5,6 5,6
Неустойчивое 4 21,1 22,2 27,8
Устойчивое 11 57,9 61,1 88,9
Очень устойчивое 2 10,5 11,1 100,0
Всего 18 94,7 100,0
Missing нет данных 1 5,3
Total 19 100,0
Гуманитар- ные науки Valid Крайне неустойчивое 10 40,0 40,0 40,0
Неустойчивое 14 56,0 56,0 96,0
Устойчивое 1 4,0 4,0 100,0
Всего 25 100,0 100,0
Психология Valid Крайне неустойчивое 3 27,3 27,3 27,3
Неустойчивое 6 54,5 54,5 81,8
Устойчивое 2 18,2 18,2 100,0
Всего 11 100,0 100,0
Теология Valid Крайне неустойчивое 2 22,2 22,2 22,2
Неустойчивое 5 55,6 55,6 77,8
Устойчивое 2 22,2 22,2 100,0
Всего 9 100,0 100,0
Медицина Valid Крайне неустойчивое 1 10,0 10,0 10,0
Неустойчивое 3 30,0 30,0 40,0
Устойчивое 5 50,0 50,0 90,0
Очень устойчивое 1 10,0 10,0 100,0
Всего 10 100,0 100,0
Естествен- ные науки Valid Неустойчивое 3 33,3 33,3 33,3
Устойчивое 6 66,7 66,7 100,0
Всего 9 100,0 100,0
Техника Valid Крайне неустойчивое 1 50,0 50,0 50,0
Устойчивое 1 50,0 50,0 100,0
Всего 2 100,0 100,0
Прочие Valid Устойчивое 1 100,0 100,0 100,0
Учтите, что файл данных останется разделенным на подгруппы, пока вы не деактивируете соответствующие опции. Для этого поступите следующим образом: 

  •  Выберите в меню команды Data (Данные) Split File... (Разделить файл)
  •  В диалоговом окне Split File выберите опцию Analyze all cases, do not create groups (Анализировать все наблюдения, не создавать группы). Теперь разделение файла убрано.
  •  Если требуется дополнительно убрать сортировку по специальностям, выберите в меню следующие команды Data (Данные) Sort Cases... (Сортировать наблюдения)
  •  Перенесите переменную fragebnr (код анкеты) в список переменных сортировки и подтвердите операцию кнопкой ОК. Данные будут отсортированы в исходном порядке — по номерам анкет.
На этом мы заканчиваем обзор возможностей отбора данных в SPSS и переходим к изучению средств модификации данных.

Содержание раздела