Главная arrow Информатика arrow Методы группировки
Как начинался компьютер
Компьютерная революция
Двоичный код
Разработки военных лет
Интегральные микросхемы
Микрокомпьютер
Персоны
Сеть
Язык компьютера
Развитие ПО
Гибкие системы
Средства разработки
Информатика
Вычислительная наука
Операционные системы
Искусственный интеллект
Предыстория
Поиск
Знания и рассуждения
Логика
Робототехника
 

 
Методы группировки Печать

Допустим, из генеральной совокупности извлечена выборка объемом n, измерена некоторая величина Х, в результате чего получен ряд значений х1, х2, . . . хn. Этот ряд называется простым статистическим рядом.

Пример: измерена масса тела 10 девочек 6 лет. Полученные данные образуют простой статистический ряд:

24 22 23 28 24 23 25 27 25 25

Отдельные значения статистического ряда называются вариантами. Если варианта хi появилась m раз, то число m называют частотой, а ее отношение к объему выборки m/n – относительной частотой.

Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным рядом.

Пример: Ранжированный ряд:

22 23 23 24 24 25 25 25 27 28

Таблица, в первой строке которой записаны все значения величины (варианты), во второй –- соответствующие им частоты, называется безынтервальным вариационным рядом.

Пример: Безынтервальный вариационный ряд

Х

22

23

24

25

27

28

m

1

2

2

3

1

1

Графическим изображением безынтервального вариационного ряда является полигон (рис. 1).

Рис. 1. Полигон вариационного ряда

Для его построения на оси ОХ откладывают значения вариант, на оси ОУ –- соответствующие им частоты. Точки с координатами (хi; mi) соединяют отрезками, полученная ломаная линия называется полигоном частот.

В том случае, если выборка представлена большим количеством различных значений непрерывной случайной величины, то группировку данных проводят в виде интервального вариационного ряда. Для этого диапазон варьирования признака разбивают на несколько (5-10) равных интервалов и указывают количество вариант, попавших в каждый интервал.

Алгоритм построения интервального вариационного ряда

1. Исходя из объема выборки n, определить количество интервалов k.

n

25-40

40-60

60-100

100-200

>200

k

5-6

6-8

7-10

8-12

10-15

2. Вычислить размах ряда: R=Xmax-Xmin

3. Определить ширину интервала: h=R/(k-1)

4. Найти начало первого интервала X0 = Xmin - h/2

5. Составить интервальный вариационный ряд.

Пример: измерена масса тела 100 женщин 30 лет, получены значения от 60 до 90 кг.

интервалы

60-65

65-70

70-75

75-80

80-85

85-90

количество

14

34

29

15

6

2

Размах ряда: R=Xmax-Xmin=90-60=30

Ширина интервала: h=R/(k-1)=30/5=6

Интервальный вариационный ряд:

Графическим изображением интервального вариационного ряда является гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной h, на каждом интервале строят прямоугольник высотой m/h. Величина m/h называется плотностью частоты. Гистограмма является эмпирическим аналогом графика дифференциальной функции распределения.