Группировка наблюдений

Группировка наблюдений

При большом числе наблюдений, $n>80$, статистический материал, помещённый в таблицу, трудно обозрим. Поэтому составляется группировка. Это делается так: Находится

  1. размах выборки,
  2. шаг выборки,
  3. интервалы { разбиение на интервалы } ,
  4. центры интервалов,
  5. абсолютные частоты,
  6. относительные частоты.
  1. Чтобы найти размах выборки надо найти максимальные и минимальные значения вариант. Разность между ними называется размахом выборки $x_ { \max } -x_ { \min } =\Delta $.
  2. Определим шаг выборки. Для этого надо разделить $\Delta $ на $k$ - частей, где $k$ должно быть не более $20\div 25$ и не менее $6\div 10$. Обычно $6\div 10\leqslant k\leqslant 20\div 25$. Иногда $k$ считают по формуле $\log _2 n+1\approx k$, где $n$ - объём выборки. Шаг выборки вычисляется по формуле $h=\frac { \Delta } { k } $.
  3. Разбить на интервалы шириной $h$ по формуле $[x_i \,,\,x_i +h)$.
  4. Найти центры интервалов по формуле $x_i =\frac { x_i +x_ { i+1 } } { 2 } $.
  5. Найти абсолютные частоты. Для этого нужно подсчитать число выборочных значений $n_i $ величины $X$, попадающей в каждый интервал. Существует контроль $\sum { n_i =n } $.
  6. Подсчитать относительные частоты по формуле $W_i =\frac { n_i } { n } $.
  7. Выписать полученные интервалы или центры интервалов, выборочные значения и относительные частоты в таблицу.
  8. Представить выборку графически. Графическим представлением является полигон и гистограмма.

Полигон и гистограмма

Определение Полигоном абсолютных частот называют ломаную линию, отрезки которой соединяют точки $( { x_1 ,n_1 } ),( { x_2 ,n_2 } ),( { x_3 ,n_3 } )\ldots ( { x_k ,n_k } )$.

На оси абсцисс откладывают варианты $x_i $, на оси ординат - соответствующие им частоты $n_i $.

Определение Полигоном относительных частот называют ломаную линию, отрезки которой соединяют точки $( { x_1 ,w_1 } ),( { x_2 ,w_2 } ),( { x_3 ,w_3 } )\ldots ( { x_k ,w_k } )$. Для построения полигона относительных частот на оси $OX$ откладывают варианты $x_i $, а на оси ординат соответствующие им относительные частоты $w_i $. Точки $( { x_i ,w_i } )$ соединяют прямыми и получают полигон относительных частот.

gruppirovka-nabliudenii-0

Определение Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями служат интервалы длиной $h$, а высотами являются плотности частоты $\frac { n_i } { h } $. Площадь гистограммы частот равна сумме всех частот, т. е. объёму выборки.

Определение Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников с основаниями длиной $h$ и высотами $\frac { W_i } { h } $ { плотность относительных частот } . Площадь гистограммы равна сумме всех относительных частот, т. е. 1

gruppirovka-nabliudenii-1

Замечание Полигон и гистограмма строятся для того, чтобы получить представление о форме функции плотности распределения.

Пример группировки

Составить группировку и представить её графически, разбив на шесть интервалов

$\mathbf { 16\,\,\,\, } \mathbf { 17\,\,\,\, } \mathbf { 9\,\,\,\, } \mathbf { 13\,\,\,\, } \mathbf { 21\,\,\,\, } \mathbf { 11\,\,\,\, } \mathbf { 7\,\,\,\, } \mathbf { 19\,\,\,\, } \mathbf { 5\,\,\,\, } \mathbf { 20 } $

$\mathbf { 17\,\,\,\, } \mathbf { 5\,\,\,\,7\,\,\,\, } \mathbf { 18\,\,\,\, } \mathbf { 11\,\,\,\, } \mathbf { 4\,\,\,\,6\,\,\,\, } \mathbf { 22\,\,\,\,21\,\,\,\, } \mathbf { -1 } $

$\mathbf { 15\,\,\,\, } \mathbf { 22\,\,\,\, } \mathbf { 19\,\,\,\, } \mathbf { 23\,\,\,\, } \mathbf { 15 } $

Объём выборки $n=25$

1) $x_ { \max } =23,x_ { \min } =-1,\Delta =x_ { \max } -x_ { \min } =23+1=24$.

2) Разделим $\Delta $ на шесть частей $h=\frac { 24 } { 6 } =4$.

Вывод Будем иметь шесть интервалов, ширина интервала $h=4$.

3) Найдём выборочные значения $n_i $ в каждом интервале. Контроль $\sum { n_i =n } $

4) Подсчитаем относительные частоты $ W_i =\frac { n_i } { n } $

5) Подсчитаем плотность относительных частот $ f( x )=\frac { W_i } { h } . $

6) Строим полигон и гистограмму.

Занесем полученные значения в таблицу.

\begin{array} { |l|l|l|l|l|l|l| } \hline №& Интервал& Выборочные~частоты~ n_i & x_i -центр~интервала& W_i =\frac { n_i } { n } & f( x )=\frac { W_i } { h } & \frac { n_i } { h } \\ \hline 1& [ -1,3 ]& 1& 1& 0,04& 0,01& 0,25 \\ \hline 2& ( 3,7 ]& 6& 5& 0,24& 0,06& 1,5 \\ \hline 3& ( 7,11 ]& 3& 9& 0,12& 0,03& 0,75 \\ \hline 4& ( 11,15 ]& 3& 13& 0,12& 0,03& 0,75 \\ \hline 5& ( 15,19 ]& 6& 17& 0,24& 0,06& 1,5 \\ \hline 6& ( 19,23 ]& 6& 21& 0,24& 0,06& 1,5 \\ \hline \sum & & \sum { n_i =n } =25& & \sum { W_i =1 } & &\\ \hline \end{array}

Гистограмма частот n$_ { i } $

gruppirovka-nabliudenii-2 полигон частот $n_i $ для средины интервалов

gruppirovka-nabliudenii-3

Гистограмма плотности частот $\frac { n_i } { h } $

gruppirovka-nabliudenii-4

Гистограмма плотности относительных частот $\frac { W_i } { h } $

Эта величина носит вероятностный характер.

gruppirovka-nabliudenii-5

По полученной гистограмме выдвигается гипотеза о равномерном распределении.