Cайты для работы и коммуникаций

Лучше один раз увидеть, чем 100 раз услышать!

Элементы математической статистики. Статистическое распределение выборки

Элементы математической статистики

Математическая статистика изучает массовые случайные явления методами теории вероятностей. Отличие вероятности от статистики в том, что вероятность есть модель, свойства которой изучаются.

На практике мы имеем ряд данных и по этим данным надо подобрать подходящую модель и уже по подобранной модели можно посчитать вероятностные характеристики. Термин "статистика" имеет несколько смысловых значений:

  1. Совокупность показателей характеризующих процесс,
  2. Совокупность приёмов сбора информации,
  3. Совокупность приёмов обработки информации,
  4. Разработка новых методов обработки информации.

Мы будем изучать статистику только в смысле термина "3". Выделим основные приёмы математической статистики.

  1. Оценка неизвестной функции распределения.
  2. Оценка параметров распределения.
  3. Проверка статистических гипотез.
  4. Корреляционный анализ.

Статистическое распределение выборки

В статистике применяются уже известные нам термины: генеральная совокупность, выборка. Выборка должна быть представительной или репрезентативной { т. е. отражать набор данных } .

Установление статистических закономерностей основано на изучении статистических данных - сведений о том, какие значения принял в результате наблюдений интересующий нас признак { случайная величина Х } .

Различные значения признака случайной величины называются вариантами.

Опр Последовательность вариантов, записанная в возрастающем порядке, называется вариационным рядом.

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину и - непрерывным { интервальным } , если варианты могут отличаться один от другого на сколь угодно малую величину.

Пусть из генеральной совокупности извлечена выборка, причём

$x_1-$ наблюдалоcь $n_1$ раз

$x_2-$ наблюдалось $n_2$ раз

$x_3-$ наблюдалось $n_3$ раз

$\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots$

$x_k-$ наблюдалось $n_k$ раз и

$\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots$

$\sum { n_i =n } -$ объему выборки

$n_1 ,n_2 ,...,n_k -$ числа наблюдений называемые абсолютными частотами.

$x_1 ,x_2 ,...,x_k -$ наблюдаемые значения называемые вариантами.

Отношения $n_1 ,n_2 ,...,n_k$ к объёму выборки называются относительными { эмпирическими } частотами $ W_i =\frac { n_i } { n } $

Определение Статистическим распределением выборки называется перечень вариантов и соответствующих им частот или относительных частот, представленных в виде таблицы.

Задать статистическое распределение можно в виде последовательности интервалов и соответствующих им частот.

Замечание В качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал.

Пример. Имея конкретную выборку: 2, 6, 12, 6, 6, 2, 6,12, 12, 6, 6, 6, 12, 12, 6, 12, 2, 6, 12, 6 (n=20), записать вариационный ряд и таблицу статистического распределения выборки.

Решение. Составим вариационный ряд - запишем варианты в возрастающем порядке 2, 2, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 12, 12, 12, 12, 12, 12, 12.

Статистическое распределение выборки

\begin{array} { |l|l|l|l| } \hline Варианты& 2& 6& 12 \\ \hline Абсолютные~частоты - n_i & 3& 10& 7 \\ \hline Относительные~частоты~ W_i =\frac { n_i } { n } & \frac { 3 } { 20 } & \frac { 10 } { 20 } & \frac { 7 } { 20 } \\ \hline \end{array}

Контроль: $\frac { 3 } { 20 } +\frac { 10 } { 20 } +\frac { 7 } { 20 } =1$.