Элементы математической статистики. Статистическое распределение выборки

Элементы математической статистики

Математическая статистика изучает массовые случайные явления методами теории вероятностей. Отличие вероятности от статистики в том, что вероятность есть модель, свойства которой изучаются.

На практике мы имеем ряд данных и по этим данным надо подобрать подходящую модель и уже по подобранной модели можно посчитать вероятностные характеристики. Термин "статистика" имеет несколько смысловых значений:

  1. Совокупность показателей характеризующих процесс,
  2. Совокупность приёмов сбора информации,
  3. Совокупность приёмов обработки информации,
  4. Разработка новых методов обработки информации.

Мы будем изучать статистику только в смысле термина "3". Выделим основные приёмы математической статистики.

  1. Оценка неизвестной функции распределения.
  2. Оценка параметров распределения.
  3. Проверка статистических гипотез.
  4. Корреляционный анализ.

Статистическое распределение выборки

В статистике применяются уже известные нам термины: генеральная совокупность, выборка. Выборка должна быть представительной или репрезентативной {т. е. отражать набор данных}.

Установление статистических закономерностей основано на изучении статистических данных - сведений о том, какие значения принял в результате наблюдений интересующий нас признак {случайная величина Х}.

Различные значения признака случайной величины называются вариантами.

Опр Последовательность вариантов, записанная в возрастающем порядке, называется вариационным рядом.

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину и - непрерывным {интервальным}, если варианты могут отличаться один от другого на сколь угодно малую величину.

Пусть из генеральной совокупности извлечена выборка, причём

$x_1-$ наблюдалоcь $n_1$ раз

$x_2-$ наблюдалось $n_2$ раз

$x_3-$ наблюдалось $n_3$ раз

$\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots$

$x_k-$ наблюдалось $n_k$ раз и

$\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots$

$\sum {n_i =n} -$ объему выборки

$n_1 ,n_2 ,...,n_k -$ числа наблюдений называемые абсолютными частотами.

$x_1 ,x_2 ,...,x_k -$ наблюдаемые значения называемые вариантами.

Отношения $n_1 ,n_2 ,...,n_k$ к объёму выборки называются относительными {эмпирическими} частотами $ W_i =\frac{n_i }{n} $

Определение Статистическим распределением выборки называется перечень вариантов и соответствующих им частот или относительных частот, представленных в виде таблицы.

Задать статистическое распределение можно в виде последовательности интервалов и соответствующих им частот.

Замечание В качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал.

Пример. Имея конкретную выборку: 2, 6, 12, 6, 6, 2, 6,12, 12, 6, 6, 6, 12, 12, 6, 12, 2, 6, 12, 6 (n=20), записать вариационный ряд и таблицу статистического распределения выборки.

Решение. Составим вариационный ряд - запишем варианты в возрастающем порядке 2, 2, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 12, 12, 12, 12, 12, 12, 12.

Статистическое распределение выборки

\begin{array}{|l|l|l|l|} \hline Варианты& 2& 6& 12 \\ \hline Абсолютные~частоты - n_i & 3& 10& 7 \\ \hline Относительные~частоты~ W_i =\frac{n_i }{n}& \frac{3}{20}& \frac{10}{20}& \frac{7}{20}\\ \hline \end{array}

Контроль: $\frac{3}{20}+\frac{10}{20}+\frac{7}{20}=1$.