Стохастическая зависимость. Стохастическая эмпирическая зависимость

Стохастическая эмпирическая зависимость

Зависимость между случайными величинами называется стохастической зависимостью. Она проявляется в изменении закона распределения одной из них (зависимой переменной) при изменении других (аргументов).

Графически стохастическая эмпирическая зависимость, в системе координат зависимая переменная - аргументы , представляет собой множество случайно расположенных точек, которое отражает общую тенденцию поведения зависимой переменной при изменении аргументов.

Стохастическая эмпирическая зависимость от одного аргумента называется парной зависимостью, если аргументов более одного - многомерной зависимостью. Пример парной линейной зависимости приведён на рис. 1.()

Рис. 1.

В отличие от обычной функциональной зависимости, в которой изменениям значения аргумента (или нескольких аргументов) отвечает изменение детерминированной зависимой переменной, в стохастической зависимости при этом происходит изменение статистического распределения случайной зависимой переменной, в частности, математического ожидания.

Задача математического моделирования (аппроксимации)

Построение стохастической зависимости иначе называется математическим моделированием (аппроксимацией) или приближением и состоит в нахождении её математического выражения (формулы).

Эмпирически установленная формула (функция), которая отражает не всегда известную, но объективно существующую истинную зависимость и отвечает основному, устойчивому, повторяющемуся отношению между предметами, явлениями или их свойствами, рассматривается как математическая модель.

Устойчивое отношение вещей и их истинная зависимость. моделируется она или нет, существует объективно, имеет математическое выражение, и рассматривается как закон или его следствие.

Если подходящие закон или следствие из него известны, то их естественно рассматривать в качестве искомой аналитической зависимости. Например, эмпирическая зависимость силы тока I в цепи от напряжения U и сопротивления нагрузки R следует из закона Ома:

К сожалению, истинная зависимость переменных в подавляющем большинстве случаев априорно неизвестна, поэтому возникает необходимость её обнаружения, исходя из общих соображений и теоретических представлений, то есть построения математической модели рассматриваемой закономерности. При этом учитывается, что заданные переменные и их приращения на фоне случайных колебаний отражают математические свойства искомой истинной зависимости(поведение касательных, экстремумы, корни, асимптоты и т.п.)

Подбираемая, так или иначе, аппроксимирующая функция сглаживает (усредняет) случайные колебания исходных эмпирических значений зависимой переменной и, подавляя тем самым случайную составляющую, является приближением к регулярной составляющей и, стало быть, к искомой истинной зависимости.

Математическая модель эмпирической зависимости имеет теоретическое и практическое значение:

· позволяет установить адекватность экспериментальных данных тому или иному известному закону и выявить новые закономерности;

· решает для зависимой переменной задачи интерполяции внутри заданного интервала значений аргумента и прогнозирования (экстраполяции) за пределами интервала.

Однако, несмотря на большой теоретический интерес нахождения математической формулы для зависимости величин, на практике часто достаточно лишь определить, есть ли между ними связь и какова её сила.

Задача корреляционного анализа

Методом изучения взаимосвязи между изменяющимися величинами является корреляционный анализ.

Ключевым понятием корреляционного анализа, описывающим связь между переменными является корреляция (от английского correlation - согласование, связь, взаимосвязь, соотношение, взаимозависимость ).

Корреляционный анализ используется для обнаружения стохастической зависимости и оценки её силы (значимости) по величине коэффициентов корреляции и корреляционного отношения.

Если связь между переменными обнаружена, то говорят, что корреляция присутствует или что переменные коррелированны.

Показатели тесноты связи (коэффициент корреляции, корреляционное отношение) по модулю изменяются от 0(при отсутствии связи) до 1(при вырождении стохастической зависимости в функциональную).

Стохастическая связь полагается значимой (реальной), если абсолютная оценка коэффициента корреляции (корреляционного отношения) значима, то есть в 2-3 превышает стандартное отклонение оценки коэффициента.

Отметим, что в некоторых случаях связь может быть обнаружена между явлениями, не находящимися в очевидных причинно-следственных отношениях.

Например, для некоторых сельских районов выявлена прямая стохастическая связь между числом гнездящихся аистов и рождающихся детей. Весенний подсчёт аистов позволяет предсказывать, сколько в этом году родится детей, но зависимость, конечно, не доказывает известное поверье, и объясняется параллельными процессами:

· рождению детей обычно предшествует образование и обустройство новых семей с обзаведением сельскими домами и подворьями;

· расширение возможностей гнездования привлекает птиц и увеличивает их количество.

Подобная корреляция между признаками называется ложной(мнимой) корреляцией, хотя она может иметь прикладное значение.

Рассматривая зависимость между признаками, выделим прежде всего зависимость между изменением факторного и результативного признаков, когда вполне определенному значению факторного признака соответствует множество возможных значений результативного признака. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость называется стохастической. Возникновение понятия стохастической зависимости обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что изменение значений переменных неизбежно сопровождается некоторыми случайными ошибками. Примером стохастической связи является зависимость урожайности сельскохозяйственных культур Y от массы внесенных удобрений X. Точно предсказать урожайность мы не можем, так как на нее влияет множество факторов (осадки, состав почвы и т.д.). Однако очевидно, что с изменением массы удобрений будет меняться и урожайность.

В статистике изучаются наблюдаемые значения признаков, поэтому стохастическую зависимость называют обычно статистической зависимостью.

В силу неоднозначности статистической зависимости между значениями результативного признака У и значениями факторного признака X представляет интерес усредненная по X схема зависимости, т.е. закономерность, выражаемая условным математическим ожиданием M(Y/X = х) (вычисленного при фиксированном значении факторного признака X = х ). Зависимости такого рода называются регрессионными , а функция ср(х) = M(Y/X = х) - функцией регрессии Y на X или прогнозом Y по X (обозначение у х = ф(л)). При этом результативный признак Y называют также функцией отклика или объясняемой, выходной, результирующей, эндогенной переменной, а факторный признак X - регрессором или объясняющей, входной, предсказывающей, предикторной, экзогенной переменной.

В параграфе 4.7 доказывалось, что условное математическое ожидание M(Y/X) = ср(х) дает наилучший прогноз У по X в среднеквадратическом смысле, т.е. M(Y- ф(х)) 2 M(Y-g(x)) 2 , где g(x) - любой другой прогноз УпоХ.

Итак, регрессия - это односторонняя статистическая зависимость, устанавливающая соответствия между признаками. В зависимости от числа факторных признаков, описывающих явление, различают парную и множественную регрессии. Например, парная регрессия - это регрессия между затратами на производство (факторный признак X) и объемом продукции, производимой предприятием (результативный признак У). Множественная регрессия - это регрессия между производительностью труда (результативный признак У) и уровнем механизации производственных процессов, фондом рабочего времени, материалоемкостью, квалификацией рабочих (факторные признаки X t , Х 2 , Х 3 , Х 4).

По форме различают линейную и нелинейную регрессии, т.е. регрессии, выражаемые линейной и нелинейной функциями.

Например, ф(Х) = аХ + Ъ - парная линейная регрессия; ф(Х) = аХ 2 + + ЬХ + с - квадратическая регрессия; ф(Х 1? Х 2 ,..., Х п ) = р 0 4- fi { X { + р 2 Х 2 + ... + p„X w - множественная линейная регрессия.

Проблема выявления статистической зависимости имеет две стороны: установление тесноты (силы) связи и определение формы связи.

Установлению тесноты (силы) связи посвящен корреляционный анализ , назначение которого - получить на основе имеющихся статистических данных ответы на следующие основные вопросы:

как выбрать подходящий измеритель статистической связи (коэффициент корреляции, корреляционное отношение, ранговый коэффициент корреляции и т.п.);
как проверить гипотезу о том, что полученное числовое значение измерителя связи действительно свидетельствует о наличии статистической связи.

Определением формы связи занимается регрессионный анализ. При этом назначение регрессионного анализа - решение на основе имеющихся статистических данных следующих задач:

выбор вида функции регрессии (выбор модели);
нахождение неизвестных параметров выбранной функции регрессии;
анализ качества функции регрессии и проверка адекватности уравнения эмпирическим данным;
прогноз неизвестных значений результативного признака по заданным значениям факторных признаков.

На первый взгляд может показаться, что понятие регрессии сходно с понятием корреляции, так как в обоих случаях речь идет о статистической зависимости между исследуемыми признаками. Однако на самом деле между ними есть существенные различия. Регрессия подразумевает причинную взаимосвязь, когда изменение условного среднего значения результативного признака происходит вследствие изменения факторных признаков. Корреляция же ничего не говорит о причинной зависимости между признаками, т.е. если установлено наличие корреляции между X и У, то этот факт не подразумевает того, что изменения значений X обусловливают изменение условного среднего значения У. Корреляция всего лишь констатирует факт того, что изменения одной величины в среднем соотносятся с изменениями другой.

Между различными явлениями и их признаками необходимо прежде всего выделить 2типа связей: функциональную (жестко детерминированную) и статистическую (стохастически детерминированную).

В соответствии с жестко детерминистическим представлением о функционировании экономических систем необходимость и закономерность однозначно проявляются в каждом отдельном явлении, то есть любое действие вызывает строго определенный результат; случайными (непредвиденными заранее) воздействиями при этом пренебрегают. Поэтому при заданных начальных условиях состояние такой системы может быть определено с вероятностью, равной 1. Разновидностью такой закономерности является функциональная связь.

Связь признака у с признакомх называется функциональной, если каждому возможному значению независимого признаках соответствует 1 или несколько строго определенных значений зависимого признакау . Определение функциональной связи может быть легко обобщено для случая многих признаковх 1 ,х 2 …х n .

Характерной особенностью функциональных связей является то, что в каждом отдельном случае известен полный перечень факторов, определяющих значение зависимого (результативного) признака, а также точный механизм их влияния, выраженный определенным уравнением.

Функциональную связь можно представить уравнением:

y i =  (x i ) ,

где y i - результативный признак (i = 1, … , n );

f(x i ) - известная функция связи результативного и факторного признаков;

x i - факторный признак.

В реальной общественной жизни ввиду неполноты информации жестко детерминированной системы, может возникнуть неопределенность, из-за которой эта система по своей природе должна рассматриваться как вероятностная, при этом связь между признаками становится стахостической.

Стахостическая связь – это связь между величинами, при которой одна из них, случайная величинау , реагирует на изменение другой величиных или других величинх 1 ,х 2 …х n (случайных или неслучайных) изменением закона распределения. Это обуславливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подвержена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью.

Характерной особенностью стахостических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице. Причём неизвестен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком. Всегда имеет место влияние случайного. Появляющиеся различные значения зависимой переменной – реализация случайной величины.

Модель стохастической связи может быть представлена в общем виде уравнением:

ŷ i =  (x i ) +  i ,

где ŷ i - расчётное значение результативного признака;

f(x i ) - часть результативного признака, сформировавшаяся под воздействием учтенных известных факторных признаков(одного или множества), находящихся в стахостической связи с признаком;

 i - часть результативного признака, возникшая в следствие действия неконтролируемых или неучтенных факторов, а также измерения признаков, неизбежно сопровождающегося некоторыми случайными ошибками.

Проявление стохастических связей подвержено действию закона больших чисел : лишь в достаточно большом числе единиц индивидуальные особенности сгладятся, случайности взаимопогасятся, и зависимость, если она имеет существенную силу, проявится достаточно отчётливо.

Корреляционная связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. При такой связи среднее значение (математическое ожидание) случайной величины результативного признакау закономерно изменяется в зависимости от изменения другой величиных или других случайных величинх 1 ,х 2 …х n . Корреляционная связь проявляется не в каждом отдельном случае, а во всей совокупности в целом. Только при достаточно большом количестве случаев каждому значению случайного признаках будет соответствовать распределение средних значений случайного признакау . Наличие корреляционных связей присуще многим общественным явлениям.

Корреляционная связь – понятие более узкое, чем стохастическая связь. Последняя может отражаться не только в изменении средней величины, но и в вариации одного признака в зависимости от другого, то есть любой другой характеристики вариации. Таким образом, корреляционная связь является частным случаем стохастической связи.

Прямые и обратные связи. В зависимости от направления действия, функциональные и стахостические связи могут быть прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный, и, наоборот, с уменьшением факторного признака уменьшается и результативный признак. В противном случае между рассматриваемыми величинами существуют обратные связи. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда – прямая связь. А чем выше производительность труда, тем ниже себестоимость единицы продукции – обратная связь.

Прямолинейные и криволинейные связи. По аналитическому выражению (форме) связи могут быть прямолинейными и криволинейными. При прямолинейной связи с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически – прямой линией. Отсюда ее более короткое название – линейная связь. При криволинейных связях с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно, или же направление его изменения меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).

Однофакторные и многофакторные связи. По количеству факторов, действующих на результативный признак, связи различаются: однофакторные (один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются парными (т.к. рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи. Например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками. С помощью множественной корреляции можно охватить весь комплекс факторных признаков и объективно отразить существующие множественные связи.

Принципиальная идея, с которой сталкивается ис-следователь социально-экономических процессов и явлений, - это понимание природы взаимосвязей между экономическими переменными. Формирующийся на рынке спрос на определенный товар рассматривается как функция цены, доходность активов зависит от степени риска вложений, потребительские расходы могут быть функцией от доходов.
В процессе статистического анализа и прогнозирования социально-экономических явлений необходимо количественно описать самые существенные взаимосвязи. Для достоверного отражения сущности и характера явле-ний и процессов следует выявлять причинно-следственные отношения. Причинная связь характеризуется временной последовательностью причины и следствия: причина всегда предшествует следствию. Однако для корректного понимания следует исключать совпадения событий, не имеющих причинной взаимосвязи.
Многие социально-экономические явления представляют результат одновременно и совокупно действующих причин. В таких случаях отделяются главные причины от второстепенных, несущественных.
Между явлениями различают два вида зависимостей: функциональную, или жестко детерминированную, и статистическую, или стохастически детерминированную. При функциональной зависимости каждому значению независимой переменной х однозначно соответствует вполне определенное значение зависимой переменной у. Эту зависимость можно описать в виде равенства у = f(x) . Приме- ром такой зависимости могут быть законы механики, справедливые для каждой отдельно взятой единицы совокупности без случайных отклонений.
Статистическая, или стохастическая зависимость, проявляется только в массовых явлениях, при большом числе единиц совокупности. При стохастической за-висимости для заданных значений независимой переменной х можно указать ряд значений у, случайно рассеянных в интервале. Каждому фиксированному значению аргумента соответствует определенное статистическое распределение значений функции. Это связано с тем, что зависимая переменная, кроме выделенной переменной х, подвержена влиянию также других неконтролируемых или неучтенных факторов, а также с тем, что накладываются ошибки измерения. (2, с. 12). Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью. Появляющиеся значения зависимой переменной являются реализациями случайной величины.
Односторонняя стохастическая зависимость одной случайной переменной от другой или нескольких других случайных переменных рассматривается как регрессия. Функция, при помощи которой выражается односторонняя стохастическая зависимость, называется функцией регрессии или просто регрессией.
Существует различие между функциональной зависимостью и регрессией. Кроме того, что переменная х при функциональной зависимости^ =f(x) полностью определяет значение функции^, функция обратима, т.е. существует обратная функция х = f(у). Функция регрессии таким свойством не обладает. Только в предельном случае, когда стохастическая зависимость переходит в функциональную зависимость, из одного уравнения регрессии можно перейти в другое.
Формализация вида уравнения регрессии неадекватна целям, связанным с измерениями в экономике и с анализом тех или иных форм зависимостей между пере-менными. Решение подобных задач становится возможным в результате введения в экономические соотношения стохастического члена:
При изучении зависимостей следует иметь в виду, что функция регрессии только формально устанавливает соответствие между переменными, в то время как они могут не состоять в причинно-следственных отношениях. В этом случае могут возникнуть ложные регрессии вследствие случайных совпадений в вариациях переменных, которые не имеют содержательного смысла. Поэтому обязательным этапом перед подбором уравнения регрессии является качественный анализ зависимости между независимой переменной х и зависимой переменной у, основанный на предварительных гипотезах.

Между различными явлениями и их признаками необходимо прежде всего выделить два типа связей: функциональную (жестко детерминированную) и статистическую (стохастическую детерминированную).

Связь признака y с признаком x называется функциональной, если каждому возможному значению независимого признака x соответствует одно или несколько строго определенных значений зависимого признака y. Определение функциональной связи может быть легко обобщено для случая многих признаков x1,x2,…,x n .

Характерной особенностью функциональных связей является то, что в каждом отдельном случае известен полный перечень факторов, определляющих значение зависимого (результтативного) признака, а также точный механизм их влияния, выраженного определенным уравнением.

Функциональную связь можно представить уравнением:

Где y i - результативный признак (i=1,…, n)

f(x i) – известная функция связи результативного и факторного признака

x i – факторный признак.

Стохастическая связь- это связь между величинами, при которых одна из них, случайная величина y, реагирует на изменение другой величины x или других величин x1, x2,…, x n , (случайных или неслучайных) изменением закона распределения. Это обуславливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подвержена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью.

Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице (причем не известен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком). Всегда имеет место влияние случайного. Появляющиеся различные значения зависимой переменной- реализации случайной величины.

Модель стохастической связи может быть представлена в общем виде уравнением:

Где y i – расчетное значение результативного признака

f(x i) – часть результативного признака, сформировавшаяся под воздействием учтенных известных факторных признаков (одного или множества), находящихся в стохастической связи с признаком

ε i – часть результативного признака, возникшая вследствие действия неконтролируемых или неучтенных факторов, а также измерения признаков неизбежно сопровождающегося некоторыми случайными ошибками.

Стохастическая эмпирическая зависимость

Задача математического моделирования (аппроксимации)

Задача корреляционного анализа

Выбор редакции