Нормальный закон распределения вероятностей. Нормальное распределение Случайная величина имеет распределение

Главная / Н. А. Некрасов

Случайной величиной называют переменную величину, которая в результате каждого испытания принимает одно заранее неизвестное значение, зависящее от случайных причин. Случайные величины обозначают заглавными латинскими буквами: $X,\ Y,\ Z,\ \dots $ По своему типу случайные величины могут быть дискретными и непрерывными .

Дискретная случайная величина - это такая случайная величина, значения которой могут быть не более чем счетными, то есть либо конечными, либо счетными. Под счетностью имеется ввиду, что значения случайной величины можно занумеровать.

Пример 1 . Приведем примеры дискретных случайных величин:

а) число попаданий в мишень при $n$ выстрелах, здесь возможные значения $0,\ 1,\ \dots ,\ n$.

б) число выпавших гербов при подкидывании монеты, здесь возможные значения $0,\ 1,\ \dots ,\ n$.

в) число прибывших кораблей на борт (счетное множество значений).

г) число вызовов, поступающих на АТС (счетное множество значений).

1. Закон распределения вероятностей дискретной случайной величины.

Дискретная случайная величина $X$ может принимать значения $x_1,\dots ,\ x_n$ с вероятностями $p\left(x_1\right),\ \dots ,\ p\left(x_n\right)$. Соответствие между этими значениями и их вероятностями называется законом распределения дискретной случайной величины . Как правило, это соответствие задается с помощью таблицы, в первой строке которой указывают значения $x_1,\dots ,\ x_n$, а во второй строке соответствующие этим значениям вероятности $p_1,\dots ,\ p_n$.

$\begin{array}{|c|c|}
\hline
X_i & x_1 & x_2 & \dots & x_n \\
\hline
p_i & p_1 & p_2 & \dots & p_n \\
\hline
\end{array}$

Пример 2 . Пусть случайная величина $X$ - число выпавших очков при подбрасывании игрального кубика. Такая случайная величина $X$ может принимать следующие значения $1,\ 2,\ 3,\ 4,\ 5,\ 6$. Вероятности всех этих значений равны $1/6$. Тогда закон распределения вероятностей случайной величины $X$:

$\begin{array}{|c|c|}
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline

\hline
\end{array}$

Замечание . Поскольку в законе распределения дискретной случайной величины $X$ события $1,\ 2,\ \dots ,\ 6$ образуют полную группу событий, то в сумме вероятности должны быть равны единице, то есть $\sum{p_i}=1$.

2. Математическое ожидание дискретной случайной величины.

Математическое ожидание случайной величины задает ее «центральное» значение. Для дискретной случайной величины математическое ожидание вычисляется как сумма произведений значений $x_1,\dots ,\ x_n$ на соответствующие этим значениям вероятности $p_1,\dots ,\ p_n$, то есть: $M\left(X\right)=\sum^n_{i=1}{p_ix_i}$. В англоязычной литературе используют другое обозначение $E\left(X\right)$.

Свойства математического ожидания $M\left(X\right)$:

$M\left(X\right)$ заключено между наименьшим и наибольшим значениями случайной величины $X$.
Математическое ожидание от константы равно самой константе, т.е. $M\left(C\right)=C$.
Постоянный множитель можно выносить за знак математического ожидания: $M\left(CX\right)=CM\left(X\right)$.
Математическое ожидание суммы случайных величин равно сумме их математических ожиданий: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$.
Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$.

Пример 3 . Найдем математическое ожидание случайной величины $X$ из примера $2$.

$$M\left(X\right)=\sum^n_{i=1}{p_ix_i}=1\cdot {{1}\over {6}}+2\cdot {{1}\over {6}}+3\cdot {{1}\over {6}}+4\cdot {{1}\over {6}}+5\cdot {{1}\over {6}}+6\cdot {{1}\over {6}}=3,5.$$

Можем заметить, что $M\left(X\right)$ заключено между наименьшим ($1$) и наибольшим ($6$) значениями случайной величины $X$.

Пример 4 . Известно, что математическое ожидание случайной величины $X$ равно $M\left(X\right)=2$. Найти математическое ожидание случайной величины $3X+5$.

Используя вышеуказанные свойства, получаем $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\cdot 2+5=11$.

Пример 5 . Известно, что математическое ожидание случайной величины $X$ равно $M\left(X\right)=4$. Найти математическое ожидание случайной величины $2X-9$.

Используя вышеуказанные свойства, получаем $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\cdot 4-9=-1$.

3. Дисперсия дискретной случайной величины.

Возможные значения случайных величин с равными математическими ожиданиями могут по-разному рассеиваться вокруг своих средних значений. Например, в двух студенческих группах средний балл за экзамен по теории вероятностей оказался равным 4, но в одной группе все оказались хорошистами, а в другой группе - только троечники и отличники. Поэтому возникает необходимость в такой числовой характеристике случайной величины, которая бы показывала разброс значений случайной величины вокруг своего математического ожидания. Такой характеристикой является дисперсия.

Дисперсия дискретной случайной величины $X$ равна:

$$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2}.\ $$

В англоязычной литературе используются обозначения $V\left(X\right),\ Var\left(X\right)$. Очень часто дисперсию $D\left(X\right)$ вычисляют по формуле $D\left(X\right)=\sum^n_{i=1}{p_ix^2_i}-{\left(M\left(X\right)\right)}^2$.

Свойства дисперсии $D\left(X\right)$:

Дисперсия всегда больше или равна нулю, т.е. $D\left(X\right)\ge 0$.
Дисперсия от константы равна нулю, т.е. $D\left(C\right)=0$.
Постоянный множитель можно выносить за знак дисперсии при условии возведения его в квадрат, т.е. $D\left(CX\right)=C^2D\left(X\right)$.
Дисперсия суммы независимых случайных величин равна сумме их дисперсий, т.е. $D\left(X+Y\right)=D\left(X\right)+D\left(Y\right)$.
Дисперсия разности независимых случайных величин равна сумме их дисперсий, т.е. $D\left(X-Y\right)=D\left(X\right)+D\left(Y\right)$.

Пример 6 . Вычислим дисперсию случайной величины $X$ из примера $2$.

$$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2}={{1}\over {6}}\cdot {\left(1-3,5\right)}^2+{{1}\over {6}}\cdot {\left(2-3,5\right)}^2+\dots +{{1}\over {6}}\cdot {\left(6-3,5\right)}^2={{35}\over {12}}\approx 2,92.$$

Пример 7 . Известно, что дисперсия случайной величины $X$ равна $D\left(X\right)=2$. Найти дисперсию случайной величины $4X+1$.

Используя вышеуказанные свойства, находим $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0=16D\left(X\right)=16\cdot 2=32$.

Пример 8 . Известно, что дисперсия случайной величины $X$ равна $D\left(X\right)=3$. Найти дисперсию случайной величины $3-2X$.

Используя вышеуказанные свойства, находим $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)=4D\left(X\right)=4\cdot 3=12$.

4. Функция распределения дискретной случайной величины.

Способ представления дискретной случайной величины в виде ряда распределения не является единственным, а главное он не является универсальным, поскольку непрерывную случайную величину нельзя задать с помощью ряда распределения. Существует еще один способ представления случайной величины - функция распределения.

Функцией распределения случайной величины $X$ называется функция $F\left(x\right)$, которая определяет вероятность того, что случайная величина $X$ примет значение, меньшее некоторого фиксированного значения $x$, то есть $F\left(x\right)=P\left(X < x\right)$

Свойства функции распределения :

$0\le F\left(x\right)\le 1$.
Вероятность того, что случайная величина $X$ примет значения из интервала $\left(\alpha ;\ \beta \right)$, равна разности значений функции распределения на концах этого интервала: $P\left(\alpha < X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
$F\left(x\right)$ - неубывающая.
${\mathop{lim}_{x\to -\infty } F\left(x\right)=0\ },\ {\mathop{lim}_{x\to +\infty } F\left(x\right)=1\ }$.

Пример 9 . Найдем функцию распределения $F\left(x\right)$ для закона распределения дискретной случайной величины $X$ из примера $2$.

$\begin{array}{|c|c|}
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hline
\end{array}$

Если $x\le 1$, то, очевидно, $F\left(x\right)=0$ (в том числе и при $x=1$ $F\left(1\right)=P\left(X < 1\right)=0$).

Если $1 < x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

Если $2 < x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

Если $3 < x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

Если $4 < x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

Если $5 < x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

Если $x > 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)+P\left(X=6\right)=1/6+1/6+1/6+1/6+1/6+1/6=1$.

Итак, $F(x)=\left\{\begin{matrix}
0,\ при\ x\le 1,\\
1/6,при\ 1 < x\le 2,\\
1/3,\ при\ 2 < x\le 3,\\
1/2,при\ 3 < x\le 4,\\
2/3,\ при\ 4 < x\le 5,\\
5/6,\ при\ 4 < x\le 5,\\
1,\ при\ x > 6.
\end{matrix}\right.$

Среди законов распределения для дискретных случайных величин наиболее распространенным является биномиальный закон распределения. Биномиальное распределение имеет место в следующих условиях. Пусть случайная величина - число появлений некоторого события в независимых испытаниях, вероятность появления в отдельном испытании равна . Данная случайная величина является дискретной случайной величиной, ее возможные значения . Вероятность того, что случайная величина примет значение вычисляется по формуле Бернулли: .

Определение 15. Закон распределения дискретной случайной величины называется биномиальным законом распределения, если вероятности значений случайной величины вычисляются по формуле Бернулли. Ряд распределения будет иметь вид:

Убедимся, что сумма вероятностей различных значений случайной величины равна 1. Действительно,

Так как при данных вычислениях получилась биномиальная формула Ньютона, поэтому закон распределения называется биномиальным. Если случайная величина имеет биномиальное распределение, то ее числовые характеристики находятся по формулам:

(42) (43)

Пример 15. Имеется партия из 50 деталей. Вероятность брака для одной детали . Пусть случайная величина - число бракованных деталей в данной партии. Найти математическое ожидание, дисперсию и среднее квадратичное отклонение данной случайной величины. Решение. Случайная величина имеет биномиальное распределение, так как вероятность того, что она примет значение вычисляется по формуле Бернулли. Тогда ее математическое ожидание находится по формуле (41), а именно, ; дисперсию находим по формуле (42): . Тогда среднее квадратичное отклонение будет равно . Вопрос. Приобретено 200 лотерейных билетов, вероятность выигрыша одного билета равна 0,01. Тогда среднее число лотерейных билетов, на которые выпадут выигрыши, равно: а) 10; б) 2; в) 20; г) 1.

Закон распределения Пуассона

При решении многих практических задач приходится иметь дело с дискретными случайными величинами, которые подчиняются закону распределения Пуассона. Типичными примерами случайной величины, имеющей распределение Пуассона, являются: число вызовов на телефонной станции за некоторое время ; число отказов сложной аппаратуры за время , если известно, что отказы независимы друг от друга и в среднем на единицу времени приходится отказов.Ряд распределения будет иметь вид:

То есть вероятность того, что случайная величина примет значение вычисляется по формуле Пуассона: поэтому данный закон и называется законом распределения Пуассона. Случайная величина, распределенной по закону Пуассона, имеет следующие числовые характеристики:

Распределение Пуассона зависит от одного параметра , который является математическим ожиданием случайной величины. На рисунке 14 показан общий вид многоугольника распределения Пуассона при различных значениях параметра .

Распределение Пуассона может быть использовано как приближенное в тех случаях, когда точным распределением случайной величины является биномиальное распределение, при этом число испытаний велико, а вероятность появления события в отдельном испытании мала, поэтому закон распределения Пуассона называют законом редких событий. А еще, если математическое ожидание мало отличается от дисперсии, то есть когда . В связи с этим распределение Пуассона имеет большое количество различных приложений. Пример 16. Завод отправляет на базу 500 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,002. Найти математическое ожидание числа поврежденных при перевозке деталей. Решение. Случайная величина имеет распределение Пуассона, поэтому . Вопрос. Вероятность искажения символа при передаче сообщения равна 0,004. Чтобы среднее число искаженных символов было равно 4, надо передать 100 символов.

Примерами случайных величин, распределённых по нормальному закону, являются рост человека, масса вылавливаемой рыбы одного вида . Нормальность распределения означает следующее : существуют значения роста человека, массы рыбы одного вида, которые на интуитивном уровне воспринимаются как "нормальные" (а по сути - усреднённые), и они-то в достаточно большой выборке встречаются гораздо чаще, чем отличающиеся в бОльшую или меньшую сторону.

Нормальное распределение вероятностей непрерывной случайной величины (иногда - распределение Гаусса) можно назвать колоколообразным из-за того, что симметричная относительно среднего функция плотности этого распределения очень похожа на разрез колокола (красная кривая на рисунке выше).

Вероятность встретить в выборке те или иные значение равна площади фигуры под кривой и в случае нормального распределения мы видим, что под верхом "колокола", которому соответствуют значения, стремящиеся к среднему, площадь, а значит, вероятность, больше, чем под краями. Таким образом, получаем то же, что уже сказано: вероятность встретить человека "нормального" роста, поймать рыбу "нормальной" массы выше, чем для значений, отличающихся в бОльшую или меньшую сторону. В очень многих случаях практики ошибки измерения распределяются по закону, близкому к нормальному.

Остановимся ещё раз на рисунке в начале урока, на котором представлена функция плотности нормального распределения. График этой функции получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . На ней столбцы гистограммы представляют собой интервалы значений выборки, распределение которых близко (или, как принято говорить в статистике, незначимо отличаются от) к собственно графику функции плотности нормального распределения, который представляет собой кривую красного цвета. На графике видно, что эта кривая действительно колоколообразная.

Нормальное распределение во многом ценно благодаря тому, что зная только математическое ожидание непрерывной случайной величины и стандартное отклонение, можно вычислить любую вероятность, связанную с этой величиной.

Нормальное распределение имеет ещё и то преимущество, что один из наиболее простых в использовании статистических критериев, используемых для проверки статистических гипотез - критерий Стьюдента - может быть использован только в том случае, когда данные выборки подчиняются нормальному закону распределения.

Функцию плотности нормального распределения непрерывной случайной величины можно найти по формуле:

где x - значение изменяющейся величины, - среднее значение, - стандартное отклонение, e =2,71828... - основание натурального логарифма, =3,1416...

Свойства функции плотности нормального распределения

Изменения среднего значения перемещают кривую функции плотности нормального распределения в направлении оси Ox . Если возрастает, кривая перемещается вправо, если уменьшается, то влево.

Если меняется стандартное отклонение, то меняется высота вершины кривой. При увеличении стандартного отклонения вершина кривой находится выше, при уменьшении - ниже.

Вероятность попадания значения нормально распределённой случайной величины в заданный интервал

Уже в этом параграфе начнём решать практические задачи, смысл которых обозначен в заголовке. Разберём, какие возможности для решения задач предоставляет теория. Отправное понятие для вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал - интегральная функция нормального распределения.

Интегральная функция нормального распределения :

Однако проблематично получить таблицы для каждой возможной комбинации среднего и стандартного отклонения. Поэтому одним из простых способов вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал является использование таблиц вероятностей для стандартизированного нормального распределения.

Стандартизованным или нормированным называется нормальное распределение , среднее значение которого , а стандартное отклонение .

Функция плотности стандартизованного нормального распределения :

Интегральная функция стандартизованного нормального распределения :

На рисунке ниже представлена интегральная функция стандартизованного нормального распределения, график которой получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . Собственно график представляет собой кривую красного цвета, а значения выборки приближаются к нему.

Для увеличения рисунка можно щёлкнуть по нему левой кнопкой мыши.

Стандартизация случайной величины означает переход от первоначальных единиц, используемых в задании, к стандартизованным единицам. Стандартизация выполняется по формуле

На практике все возможные значения случайной величины часто не известны, поэтому значения среднего и стандартного отклонения точно определить нельзя. Их заменяют средним арифметическим наблюдений и стандартным отклонением s . Величина z выражает отклонения значений случайной величины от среднего арифметического при измерении стандартных отклонений.

Открытый интервал

Таблица вероятностей для стандартизированного нормального распределения, которая есть практически в любой книге по статистике, содержит вероятности того, что имеющая стандартное нормальное распределение случайная величина Z примет значение меньше некоторого числа z . То есть попадёт в открытый интервал от минус бесконечности до z . Например, вероятность того, что величина Z меньше 1,5, равна 0,93319.

Пример 1. Предприятие производит детали, срок службы которых нормально распределён со средним значением 1000 и стандартным отклонением 200 часов.

Для случайно отобранной детали вычислить вероятность того, что её срок службы будет не менее 900 часов.

Решение. Введём первое обозначение:

Искомая вероятность.

Значения случайной величины находятся в открытом интервале. Но мы умеем вычислять вероятность того, что случайная величина примет значение, меньшее заданного, а по условию задачи требуется найти равное или большее заданного. Это другая часть пространства под кривой плотности нормального распределения (колокола). Поэтому, чтобы найти искомую вероятность, нужно из единицы вычесть упомянутую вероятность того, что случайная величина примет значение, меньше заданного 900:

Теперь случайную величину нужно стандартизировать.

Продолжаем вводить обозначения:

z = (X ≤ 900) ;

x = 900 - заданное значение случайной величины;

μ = 1000 - среднее значение;

σ = 200 - стандартное отклонение.

По этим данным условия задачи получаем:

По таблицам стандартизированной случайной величине (границе интервала) z = −0,5 соответствует вероятность 0,30854. Вычтем ее из единицы и получим то, что требуется в условии задачи:

Итак, вероятность того, что срок службы детали будет не менее 900 часов, составляет 69%.

Эту вероятность можно получить, используя функцию MS Excel НОРМ.РАСП (значение интегральной величины - 1):

P (X ≥900) = 1 - P (X ≤900) = 1 - НОРМ.РАСП(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

О расчётах в MS Excel - в одном из последующих параграфах этого урока.

Пример 2. В некотором городе среднегодовой доход семьи является нормально распределённой случайной величиной со средним значением 300000 и стандартным отклонением 50000. Известно, что доходы 40 % семей меньше величины A . Найти величину A .

Решение. В этой задаче 40 % - ни что иное, как вероятность того, что случайная величина примет значение из открытого интервала, меньшее определённого значения, обозначенного буквой A .

Чтобы найти величину A , сначала составим интегральную функцию:

По условию задачи

μ = 300000 - среднее значение;

σ = 50000 - стандартное отклонение;

x = A - величина, которую нужно найти.

Составляем равенство

По статистическим таблицам находим, что вероятность 0,40 соответствует значению границы интервала z = −0,25 .

Поэтому составляем равенство

и находим его решение:

A = 287300 .

Ответ: доходы 40 % семей менее 287300.

Закрытый интервал

Во многих задачах требуется найти вероятность того, что нормально распределённая случайная величина примет значение в интервале от z 1 до z 2 . То есть попадёт в закрытый интервал. Для решения таких задач необходимо найти в таблице вероятности, соответствующие границам интервала, а затем найти разность этих вероятностей. При этом требуется вычитать меньшее значение из большего. Примеры на решения этих распространённых задач - следующие, причём решить их предлагается самостоятельно, а затем можно посмотреть правильные решения и ответы.

Пример 3. Прибыль предприятия за некоторый период - случайная величина, подчинённая нормальному закону распределения со средним значением 0,5 млн. у.е. и стандартным отклонением 0,354. Определить с точностью до двух знаков после запятой вероятность того, что прибыль предприятия составит от 0,4 до 0,6 у.е.

Пример 4. Длина изготавливаемой детали представляет собой случайную величину, распределённую по нормальному закону с параметрами μ =10 и σ =0,071 . Найти с точностью до двух знаков после запятой вероятность брака, если допустимые размеры детали должны быть 10±0,05 .

Подсказка: в этой задаче помимо нахождения вероятности попадания случайной величины в закрытый интервал (вероятность получения небракованной детали) требуется выполнить ещё одно действие.

позволяет определить вероятность того, что стандартизованное значение Z не меньше -z и не больше +z , где z - произвольно выбранное значение стандартизованной случайной величины.

Приближенный метод проверки нормальности распределения

Приближенный метод проверки нормальности распределения значений выборки основан на следующем свойстве нормального распределения: коэффициент асимметрии β 1 и коэффициент эксцесса β 2 равны нулю .

Коэффициент асимметрии β 1 численно характеризует симметрию эмпирического распределения относительно среднего. Если коэффициент асимметрии равен нулю, то среднее арифметрического значение, медиана и мода равны: и кривая плотности распределения симметрична относительно среднего. Если коэффициент асимметрии меньше нуля (β 1 < 0 ), то среднее арифметическое меньше медианы, а медиана, в свою очередь, меньше моды () и кривая сдвинута вправо (по сравнению с нормальным распределением) . Если коэффициент асимметрии больше нуля (β 1 > 0 ), то среднее арифметическое больше медианы, а медиана, в свою очередь, больше моды () и кривая сдвинута влево (по сравнению с нормальным распределением) .

Коэффициент эксцесса β 2 характеризует концентрацию эмпирического распределения вокруг арифметического среднего в направлении оси Oy и степень островершинности кривой плотности распределения. Если коэффициент эксцесса больше нуля, то кривая более вытянута (по сравнению с нормальным распределением) вдоль оси Oy (график более островершинный). Если коэффициент эксцесса меньше нуля, то кривая более сплющена (по сравнению с нормальным распределением) вдоль оси Oy (график более туповершинный).

Коэффициент асимметрии можно вычислить с помощью функции MS Excel СКОС. Если вы проверяете один массив данных, то требуется ввести диапазон данных в одно окошко "Число".

Коэффициент эксцесса можно вычислить с помощью функции MS Excel ЭКСЦЕСС. При проверке одного массива данных также достаточно ввести диапазон данных в одно окошко "Число".

Итак, как мы уже знаем, при нормальном распределении коэффициенты асимметрии и эксцесса равны нулю. Но что, если мы получили коэффициенты асимметрии, равные -0,14, 0,22, 0,43, а коэффициенты эксцесса, равные 0,17, -0,31, 0,55? Вопрос вполне справедливый, так как практически мы имеем дело лишь с приближенными, выборочными значениями асимметрии и эксцесса, которые подвержены некоторому неизбежному, неконтролируемому разбросу. Поэтому нельзя требовать строгого равенства этих коэффициентов нулю, они должны лишь быть достаточно близкими к нулю. Но что значит - достаточно?

Требуется сравнить полученные эмпирические значения с допустимыми значениями. Для этого нужно проверить следующие неравенства (сравнить значения коэффициентов по модулю с критическими значениями - границами области проверки гипотезы).

Для коэффициента асимметрии β 1 .

Функцией распределения случайной величины X называется функция F(x), выражающая для каждого х вероятность того, что случайная величина X примет значение , меньшее х

Пример 2.5. Дан ряд распределения случайной величины

Найти и изобразить графически ее функцию распределения. Решение. В соответствии с определением

F(jc) = 0 при х х

F(x) = 0,4 + 0,1 = 0,5 при 4 F{x) = 0,5 + 0,5 = 1 при х > 5.

Итак (см. рис. 2.1):

Свойства функции распределения:

1. Функция распределения случайной величины есть неотрицательная функция, заключенная между нулем и единицей:

2. Функция распределения случайной величины есть неубывающая функция на всей числовой оси, т.е. при х 2 >х

3. На минус бесконечности функция распределения равна нулю, на плюс бесконечности - равна единице, т.е.

4. Вероятность попадания случайной величины X в интервал равна определенному интегралу от ее плотности вероятности в пределах от а до b (см. рис. 2.2), т.е.

Рис. 2.2

3. Функция распределения непрерывной случайной величины (см. рис. 2.3) может быть выражена через плотность вероятности по формуле:

F(x)= Jp (*)*. (2.10)

4. Несобственный интеграл в бесконечных пределах от плотности вероятности непрерывной случайной величины равен единице:

Геометрически свойства / и 4 плотности вероятности означают, что ее график - кривая распределения - лежит не ниже оси абсцисс , и полная площадь фигуры , ограниченной кривой распределения и осью абсцисс , равна единице.

Для непрерывной случайной величины X математическое ожидание М(Х) и дисперсия D(X) определяются по формулам:

(если интеграл абсолютно сходится); или

(если приведенные интегралы сходятся).

Наряду с отмеченными выше числовыми характеристиками для описания случайной величины используется понятие квантилей и процентных точек.

Квантилем уровня q (или q-квантилем) называется такое значение x q случайной величины , при котором функция ее распределения принимает значение , равное q, т. е.

100q%-ou точкой называется квантиль X~ q .
? Пример 2.8.

По данным примера 2.6 найти квантиль xqj и 30%-ную точку случайной величины X.

Решение. По определению (2.16) F(xo t3)= 0,3, т. е.

~Y~ = 0,3, откуда квантиль х 0 3 = 0,6. 30%-ная точка случайной величины X , или квантиль Х)_о,з = xoj » находится аналогично из уравнения ^ = 0,7 . откуда *,= 1,4. ?

Среди числовых характеристик случайной величины выделяют начальные v* и центральные р* моменты к-го порядка , определяемые для дискретных и непрерывных случайных величин по формулам:

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины , подчиненной нормальному закону с параметрами , на участок от до . Для вычисления этой вероятности воспользуемся общей формулой

где - функция распределения величины .

Найдем функцию распределения случайной величины , распределенной по нормальному закону с параметрами . Плотность распределения величины равна:

. (6.3.2)

Отсюда находим функцию распределения

. (6.3.3)

Сделаем в интеграле (6.3.3) замену переменной

и приведем его к виду:

(6.3.4)

Интеграл (6.3.4) не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения или (так называемый интеграл вероятностей), для которого составлены таблицы. Существует много разновидностей таких функций, например:

;

и т.д. Какой из этих функций пользоваться – вопрос вкуса. Мы выберем в качестве такой функции

. (6.3.5)

Нетрудно видеть, что эта функция представляет собой не что иное, как функцию распределения для нормально распределенной случайной величины с параметрами .

Условимся называть функцию нормальной функцией распределения. В приложении (табл. 1) приведены таблицы значений функции .

Выразим функцию распределения (6.3.3) величины с параметрами и через нормальную функцию распределения . Очевидно,

. (6.3.6)

Теперь найдем вероятность попадания случайной величины на участок от до . Согласно формуле (6.3.1)

Таким образом, мы выразили вероятность попадания на участок случайной величины , распределенной по нормальному закону с любыми параметрами, через стандартную функцию распределения , соответствующую простейшему нормальному закону с параметрами 0,1. Заметим, что аргументы функции в формуле (6.3.7) имеют очень простой смысл: есть расстояние от правого конца участка до центра рассеивания, выраженное в средних квадратических отклонениях; - такое же расстояние для левого конца участка, причем это расстояние считается положительным, если конец расположен справа от центра рассеивания, и отрицательным, если слева.

Как и всякая функция распределения, функция обладает свойствами:

3. - неубывающая функция.

Кроме того, из симметричности нормального распределения с параметрами относительно начала координат следует, что

Пользуясь этим свойством, собственно говоря, можно было бы ограничить таблицы функции только положительными значениями аргумента, но, чтобы избежать лишней операции (вычитание из единицы), в таблице 1 приложения приводятся значения как для положительных, так и для отрицательных аргументов.

На практике часто встречается задача вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно центра рассеивания . Рассмотрим такой участок длины (рис. 6.3.1). Вычислим вероятность попадания на этот участок по формуле (6.3.7):

Учитывая свойство (6.3.8) функции и придавая левой части формулы (6.3.9) более компактный вид, получим формулу для вероятности попадания случайной величины, распределенной по нормальному закону на участок, симметричный относительно центра рассеивания:

. (6.3.10)

Решим следующую задачу. Отложим от центра рассеивания последовательные отрезки длиной (рис. 6.3.2) и вычислим вероятность попадания случайной величины в каждый из них. Так как кривая нормального закона симметрична, достаточно отложить такие отрезки только в одну сторону.

По формуле (6.3.7) находим:

(6.3.11)

Как видно из этих данных, вероятности попадания на каждый из следующих отрезков (пятый, шестой и т.д.) с точностью до 0,001 равны нулю.

Округляя вероятности попадания в отрезки до 0,01 (до 1%), получим три числа, которые легко запомнить:

0,34; 0,14; 0,02.

Сумма этих трех значений равна 0,5. Это значит, что для нормально распределенной случайной величины все рассеивания (с точностью до долей процента) укладывается на участке .

Это позволяет, зная среднее квадратическое отклонение и математическое ожидание случайной величины, ориентировочно указать интервал её практически возможных значений. Такой способ оценки диапазона возможных значений случайной величины известен в математической статистике под названием «правило трех сигма». Из правила трех сигма вытекает также ориентировочный способ определения среднего квадратического отклонения случайной величины: берут максимальное практически возможное отклонение от среднего и делят его на три. Разумеется, этот грубый прием может быть рекомендован, только если нет других, более точных способов определения .

Пример 1. Случайная величина , распределенная по нормальному закону, представляет собой ошибку измерения некоторого расстояния. При измерении допускается систематическая ошибка в сторону завышения на 1,2 (м); среднее квадратическое отклонения ошибки измерения равно 0,8 (м). Найти вероятность того, что отклонение измеренного значения от истинного не превзойдет по абсолютной величине 1,6 (м).

Решение. Ошибка измерения есть случайная величина , подчиненная нормальному закону с параметрами и . Нужно найти вероятность попадания этой величины на участок от до . По формуле (6.3.7) имеем:

Пользуясь таблицами функции (приложение, табл. 1), найдем:

; ,

Пример 2. Найти ту же вероятность, что и в предыдущем примере, но при условии, что систематической ошибки нет.

Решение. По формуле (6.3.10), полагая , найдем:

Пример 3. По цели, имеющей вид полосы (автострада), ширина которой равна 20 м, ведется стрельба в направлении, перпендикулярном автостраде. Прицеливание ведется по средней линии автострады. Среднее квадратическое отклонение в направлении стрельбы равно м. Имеется систематическая ошибка в направлении стрельбы: недолет 3 м. Найти вероятность попадания в автостраду при одном выстреле.