04.10.2023

Центрированная случайная величина. Числовые характеристики системы двух случайных величин. Ковариация и коэффициент корреляции. Преобразования случайных величин


Кроме характеристик положения – средних, типичных значений случайной величины, - употребляется еще ряд характеристик, каждая из которых описывает то или иное свойство распределения. В качестве таких характеристик чаще всего применяются так называемые моменты.

Понятие момента широко применяется в механике для описания распределения масс (статические моменты, моменты инерции и т.д.). Совершенно теми же приемами пользуются в теории вероятностей для описания основных свойств распределения случайной величины. Чаще всего применяются на практике моменты двух видов: начальные и центральные.

Начальным моментом s-го порядка прерывной случайной величины называется сумма вида:

. (5.7.1)

Очевидно, это определение совпадает с определением начального момента порядка s в механике, если на оси абсцисс в точках сосредоточены массы .

Для непрерывной случайной величины Х начальным моментом s-го порядка называется интеграл

. (5.7.2)

Нетрудно убедиться, что введенная в предыдущем n° основная характеристика положения – математическое ожидание – представляет собой не что иное, как первый начальный момент случайной величины .

Пользуясь знаком математического ожидания, можно объединить две формулы (5.7.1) и (5.7.2) в одну. Действительно, формулы (5.7.1) и (5.7.2) по структуре полностью аналогичны формулам (5.6.1) и (5.6.2), с той разницей, что в них вместо и стоят, соответственно, и . Поэтому можно написать общее определение начального момента -го порядка, справедливое как для прерывных, так и для непрерывных величин:

, (5.7.3)

т.е. начальным моментом -го порядка случайной величины называется математическое ожидание -й степени этой случайной величины.

Перед тем, как дать определение центрального момента, введем новое понятие «центрированной случайной величины».

Пусть имеется случайная величина с математическим ожиданием . Центрированной случайной величиной, соответствующей величине , называется отклонение случайной величины от её математического ожидания:

Условимся в дальнейшем везде обозначать центрированную случайную величину, соответствующую данной случайной величине, той же буквой со значком наверху.

Нетрудно убедиться, что математическое ожидание центрированной случайной величины равно нулю. Действительно, для прерывной величины

аналогично и для непрерывной величины.

Центрирование случайной величины, очевидно, равносильно переносу начала координат в среднюю, «центральную» точку, абсцисса которой равна математическому ожиданию.

Моменты центрированной случайной величины носят название центральных моментов. Они аналогичны моментам относительно центра тяжести в механике.

Таким образом, центральным моментом порядка s случайной величины называется математическое ожидание -й степени соответствующей центрированной случайной величины:

, (5.7.6)

а для непрерывной – интегралом

. (5.7.8)

В дальнейшем в тех случаях, когда не возникает сомнений, к какой случайной величине относится данный момент, мы будем для краткости вместо и писать просто и .

Очевидно, для любой случайной величины центральный момент первого порядка равен нулю:

, (5.7.9)

так как математическое ожидание центрированной случайной величины всегда равно нулю.

Выведем соотношения, связывающие центральные и начальные моменты различных порядков. Вывод мы проведем только для прерывных величин; легко убедится, что точно те же соотношения справедливы и для непрерывных величин, если заменить конечные суммы интегралами, а вероятности – элементами вероятности.

Рассмотрим второй центральный момент:

Аналогично для третьего центрального момента получим:

Выражения для и т.д. могут быть получены аналогичным путем.

Таким образом, для центральных моментов любой случайной величины справедливы формулы:

(5.7.10)

Вообще говоря, моменты могут рассматриваться не только относительно начала координат (начальные моменты) или математического ожидания (центральные моменты), но и относительно произвольной точки :

. (5.7.11)

Однако центральные моменты имеют перед всеми другими преимущество: первый центральный момент, как мы видели, всегда равен нулю, а следующий за ним, второй центральный момент при этой системе отсчета имеет минимальное значение. Докажем это. Для прерывной случайной величины при формула (5.7.11) имеет вид:

. (5.7.12)

Преобразуем это выражение:

Очевидно, эта величина достигает своего минимума, когда , т.е. когда момент берется относительно точки .

Из всех моментов в качестве характеристик случайной величины чаще всего применяются первый начальный момент (математическое ожидание) и второй центральный момент .

Второй центральный момент называется дисперсией случайной величины. Ввиду крайней важности этой характеристики среди других моментов введем для нее специальное обозначение :

Согласно определению центрального момента

, (5.7.13)

т.е. дисперсией случайной величины Х называется математическое ожидание квадрата соответствующей центрированной величины.

Заменяя в выражении (5.7.13) величину её выражением, имеем также:

. (5.7.14)

Для непосредственного вычисления дисперсии служат формулы:

, (5.7.15)

(5.7.16)

Соответственно для прерывных и непрерывных величин.

Дисперсия случайной величины есть характеристика рассеивания, разбросанности значений случайной величины около её математического ожидания. Само слово «дисперсия» означает «рассеивание».

Если обратиться к механической интерпретации распределения, то дисперсия представляет собой не что иное, как момент инерции заданного распределения масс относительно центра тяжести (математического ожидания).

Дисперсия случайной величины имеет размерность квадрата случайной величины; для наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случайной величины. Для этого из дисперсии извлекают квадратный корень. Полученная величина называется средним квадратическим отклонением (иначе – «стандартом») случайной величины . Среднее квадратическое отклонение будем обозначать :

, (5.7.17)

Для упрощения записей мы часто будем пользоваться сокращенными обозначениями среднего квадратического отклонения и дисперсии: и . В случае, когда не возникает сомнения, к какой случайной величине относятся эти характеристики, мы будем иногда опускать значок х у и и писать просто и . Слова «среднее квадратическое отклонение» иногда будем сокращенно заменять буквами с.к.о.

На практике часто применяется формула, выражающая дисперсию случайной величины через её второй начальный момент (вторая из формул (5.7.10)). В новых обозначениях она будет иметь вид:

Математическое ожидание и дисперсия (или среднее квардратическое отклонение ) – наиболее часто применяемые характеристики случайной величины. Они характеризуют наиболее важные черты распределения: его положение и степень разбросанности. Для более подробного описания распределения применяются моменты высших порядков.

Третий центральный момент служит для характеристики асимметрии (или «скошенности») распределения. Если распределение симметрично относительно математического ожидания (или, в механической интерпретации, масса распределена симметрично относительно центра тяжести), то все моменты нечетного порядка (если они существуют) равны нулю. Действительно, в сумме

при симметричном относительно законе распределения и нечетном каждому положительному слагаемому соответствует равное ему по абсолютной величине отрицательное слагаемое, так что вся сумма равна нулю. То же, очевидно, справедливо и для интеграла

,

который равен нулю, как интеграл в симметричных пределах от нечетной функции.

Естественно поэтому в качестве характеристики асимметрии распределения выбрать какой-либо из нечетных моментов. Простейший из них есть третий центральный момент. Он имеет размерность куба случайной величины: чтобы получить безразмерную характеристику, третий момент делят на куб среднего квадратического отклонения. Полученная величина носит название «коэффициент асимметрии» или просто «асимметрии»; мы обозначим её :

На рис. 5.7.1 показано два асимметричных распределения; одно из них (кривая I) имеет положительную асимметрию (); другое (кривая II) – отрицательную ().

Четвертый центральный момент служит для характеристики так называемой «крутости», т.е. островершинности или плосковершинности распределения. Эти свойства распределения описываются с помощью так называемого эксцесса. Эксцессом случайной величины называется величина

Число 3 вычитается из отношения потому, что для весьма важного и широко распространенного в природе нормального закона распределения (с которым мы подробно познакомимся в дальнейшем) . Таки образом, для нормального распределения эксцесс равен нулю; кривые, более островершинные по сравнении с нормальной, обладают положительным эксцессом; кривые более плосковершинные – отрицательным эксцессом.

На рис. 5.7.2 представлены: нормальное распределение (кривая I), распределение с положительным эксцессом (кривая II) и распределение с отрицательным эксцессом (кривая III).

Кроме рассмотренных выше начальных и центральных моментов, на практике иногда применяются так называемые абсолютные моменты (начальные и центральные), определяемые формулами

Очевидно, абсолютные моменты четных порядков совпадают с обычными моментами.

Из абсолютных моментов наиболее часто применяется первый абсолютный центральный момент

, (5.7.21)

называемый средним арифметическим отклонением. Наряду с дисперсией и средним квадратическим отклонением среднее арифметическое отклонение иногда применяется как характеристика рассеивания.

Математическое ожидание, мода, медиана, начальные и центральные моменты и, в частности, дисперсия, среднее квадратическое отклонение, асимметрия и эксцесс представляют собой наиболее употребительные числовые характеристики случайных величин. Во многих задачах практики полная характеристика случайной величины – закон распределения – или не нужна, или не может быть получена. В этих случаях ограничиваются приблизительным описанием случайной величины с помощь. Числовых характеристик, каждая из которых выражает какое-либо характерное свойство распределения.

Очень часто числовыми характеристиками пользуются для приближенной замены одного распределения другим, причем обычно стремятся произвести эту замену так, чтобы сохранились неизменными несколько важнейших моментов.

Пример 1. Производится один опыт, в результате которого может появиться или не появиться событие , вероятность которого равна . Рассматривается случайная величина – число появлений события (характеристическая случайная величина события ). Определить её характеристики: математическое ожидание, дисперсию, среднее квадратическое отклонение.

Решение. Ряд распределения величины имеет вид:

где - вероятность непоявления события .

По формуле (5.6.1) находим математическое ожидание величины :

Дисперсию величины определяем по формуле (5.7.15):

(Предлагаем читателю получить тот же результат, выразив дисперсию через второй начальный момент).

Пример 2. Производится три независимых выстрела по мишени; вероятность попадания при каждом выстреле равна 0,4. случайная величина – число попаданий. Определить характеристики величины – математическое ожидание, дисперсию, с.к.о., асимметрию.

Решение. Ряд распределения величины имеет вид:

Вычисляем числовые характеристики величины :

Заметим, что те же характеристики могли бы быть вычислены значительно проще с помощью теорем о числовых характеристиках функций (см. главу 10).

В качестве числовых характеристик системы случайного двумерного вектора (X,Y) обычно рассматриваются начальные и центральные моменты различных порядков.

Начальным моментом порядка k+s системы двух случайных величин (X,Y) или двумерного случайного вектора называется математическое ожидание произведения X k на Y s

a k , s =M (1)

Центральным моментом порядка k+s системы двух случайных величин (X,Y) называется математическое ожидание произведения на

где , - центрированные случайные величины.

Центрированной случайной величиной называется отклонение случайной величины от ее математического ожидания.

Для системы дискретных случайных величин (X,Y) получим

P{X=x i ,Y=y j }=p ij

Для системы непрерывных случайных величин (X,Y)

Порядком начального (или центрального момента) называется сумма его индексов k+s.

Начальные моменты первого порядка:

a 1,0 = M = M[X] = m x , a 1,0 = m x

a 0,1 = M = m y , a 0,1 = m y (7)

представляют собой математические ожидания случайных величин X и Y.

Центральные моменты первого порядка естественно равны нулю.

Начальные моменты второго порядка:

Центральные моменты второго порядка:

Первые два момента представляют дисперсию, а третий называется ковариацией (или корреляционным моментом ) случайных величин (X,Y), обозначается K xy:

По определению ковариации

K xy = K yx (11)

т.е. при перемене индексов местами ковариация не меняется.

Дисперсию случайных величин можно рассматривать как частный случай ковариации:

т.е. дисперсия случайных величин есть не что иное, как "ковариация ее с самой собой". (Для независимых случайных величин ковариация равна 0. Доказать самостоятельно).

Ковариацию K xy удобно выражать через начальные моменты низших порядков:

K xy =a 1,1 -a 1,0 ×a 0,1 или К xy =M-M[X]×M[Y] (13)

Полезно запомнить эту формулу: ковариация двух случайных величин равна математическому ожиданию их произведения минус произведение математических ожиданий.

Ковариация характеризует не только степень зависимости случайных величин, но также их рассеивание вокруг точки (m x ,m y) .

Размерность ковариации равна произведению размерностей случайных величин X и Y. Чтобы получить безразмерную величину, характеризующую только зависимость, ковариацию делят на произведение с.к.о. s x s y .

r xy =K xy /s x s y (14)

Величина r xy называется коэффициентом корреляции случайных величин X и Y. Этот коэффициент характеризует степень только линейной зависимости этих величин. Зависимость проявляется в том, что при возрастании одной случайной величины другая проявляет тенденцию также возрастать (или убывать). В первом случае r xy >0 и говорят, что случайные величины X и Y связаны положительной корреляцией, во втором r xy <0, и корреляция отрицательна.


Для любых случайных величин X и Y

Если ковариация двух случайных величин равна нулю: K xy =0, то случайные величины X и Y называются некоррелированными , если K xy ¹0, то коррелированными .

Из независимости случайных величин следует их некоррелированность; но из некоррелированности случайных величин (r xy =0) еще не вытекает их независимость. Если r xy =0, это означает только отсутствие линейной связи между случайными величинами; любой другой вид связи может при этом присутствовать.

имеет дисперсию равную 1 и математическое ожидание равное 0.

Нормированная случайная величина V – это отношение данной случайной величины X к ее среднему квадратичному отклонению σ

Среднее квадратичное отклонение – это квадратный корень из дисперсии

Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики X так:

MV= M(X)σ=1v, DV= 1,

где v – коэффициент вариации исходной случайной величины X.

Для функции распределения F V (x) и плотности распределения f V (x) имеем:

F V (x) = F(σx), f V (x) = σf(σx),

где F(x) – функция распределения исходной случайной величины Х , а f(x) – ее плотность вероятности.

Коэффициент корреляции.

Коэффициент корреляции – это показатель характера взаимного стохастического влияния изменения двух случайных величин. Коэффициент корреляции может принимать значения от -1 до +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0 –связь отсутствует или является существенно нелинейной. При коэффициенте корреляции равном по модулю единице говорят о функциональной связи (а именно линейной зависимости), то есть изменения двух величин можно описать линейной функцией.

Процесс называется стохастическим , если он описывается случайными переменными, значение которых меняется во времени.

Коэффициент корреляции Пирсона.

Для метрических величин применяется коэффициент корреляции Пирсона, точная формула которого была выведена Френсисом Гамильтоном. Пусть X и Y – две случайные величины, определенные на одном вероятностном пространстве. Тогда их коэффициент корреляции задается формулой:

Неравенства Чебышева.

Неравенство Маркова.

Неравенство Маркова в теории вероятностей даёт оценку вероятности, что случайная величина превзойдёт по модулю фиксированную положительную константу, в терминах её математического ожидания. Получаемая оценка обычно достаточно груба. Однако, она позволяет получить определённое представление о распределении, когда последнее не известно явным образом.

Пусть случайная величина определена на вероятностном пространстве , и её математическое ожидание конечно. Тогда

,

где a > 0.

Неравенство Чебышёва - Бьенеме.

Если E < ∞ (E – математическое ожидание), то для любого , справедливо

Закон больших чисел.

Закон больших чисел утверждает, что эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности, и усиленный закон больших чисел, когда имеет место сходимость почти всюду.



Всегда найдётся такое количество испытаний, при котором с любой заданной наперёд вероятностью частота появления некоторого события будет сколь угодно мало отличаться от его вероятности. Общий смысл закона больших чисел - совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

Слабый закон больших чисел.

Тогда Sn P M(X).

Усиленный закон больших чисел.

Тогда Sn→M(X) почти наверное.


© 2024
polyester.ru - Журнал для девушек и женщин