Методы группировки

Допустим, из генеральной совокупности извлечена выборка объемом n, измерена некоторая величина Х, в результате чего получен ряд значений х1, х2, . . . хn. Этот ряд называется простым статистическим рядом.

Пример: измерена масса тела 10 девочек 6 лет. Полученные данные образуют простой статистический ряд:

24 22 23 28 24 23 25 27 25 25

Отдельные значения статистического ряда называются вариантами. Если варианта хi появилась m раз, то число m называют частотой, а ее отношение к объему выборки m/n – относительной частотой.

Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным рядом.

Пример: Ранжированный ряд:

22 23 23 24 24 25 25 25 27 28

Таблица, в первой строке которой записаны все значения величины (варианты), во второй –- соответствующие им частоты, называется безынтервальным вариационным рядом.

Пример: Безынтервальный вариационный ряд

Х

22

23

24

25

27

28

m

1

2

2

3

1

1

Графическим изображением безынтервального вариационного ряда является полигон (рис. 1).

Рис. 1. Полигон вариационного ряда

Для его построения на оси ОХ откладывают значения вариант, на оси ОУ –- соответствующие им частоты. Точки с координатами (хi; mi) соединяют отрезками, полученная ломаная линия называется полигоном частот.

В том случае, если выборка представлена большим количеством различных значений непрерывной случайной величины, то группировку данных проводят в виде интервального вариационного ряда. Для этого диапазон варьирования признака разбивают на несколько (5-10) равных интервалов и указывают количество вариант, попавших в каждый интервал.

Алгоритм построения интервального вариационного ряда

1. Исходя из объема выборки n, определить количество интервалов k.

n

25-40

40-60

60-100

100-200

>200

k

5-6

6-8

7-10

8-12

10-15

2. Вычислить размах ряда: R=Xmax-Xmin

3. Определить ширину интервала: h=R/(k-1)

4. Найти начало первого интервала X0 = Xmin - h/2

5. Составить интервальный вариационный ряд.

Пример: измерена масса тела 100 женщин 30 лет, получены значения от 60 до 90 кг.

интервалы

60-65

65-70

70-75

75-80

80-85

85-90

количество

14

34

29

15

6

2

Размах ряда: R=Xmax-Xmin=90-60=30

Ширина интервала: h=R/(k-1)=30/5=6

Интервальный вариационный ряд:

Графическим изображением интервального вариационного ряда является гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной h, на каждом интервале строят прямоугольник высотой m/h. Величина m/h называется плотностью частоты. Гистограмма является эмпирическим аналогом графика дифференциальной функции распределения.