Лекции 15. Элементы теории корреляции
Пусть по выборке объема п получено эмпирическое распределение:
По данным наблюдений выдвигают гипотезу о законе распределения генеральной совокупности, например, предполагают, что генеральная совокупность распределена равномерно или нормально. Такие гипотезы называют статистическими. Затем для тех же объектов, которые попали в выборку, вычисляют частоты, исходя уже из теоретической гипотезы. В результате получают частоты (их называют выравнивающими (теоретическими) частотами), которые, вообще говоря, отличаются от наблюдавшихся. Как определить, правильно или нет выдвинута гипотеза, т. е. случайны ли расхождения наблюдавшихся и выравнивающих частот или эти расхождения являются следствием неправильности гипотезы? Для решения этого вопроса применяют критерии согласия эмпирических наблюдений выдвинутой гипотезе. Имеется несколько критериев согласия: Критерии согласия и позволяют оценить вероятность того, что полученная выборка не противоречит сделанному предположению о виде закона распределения рассматриваемой случайной величины. В различных критериях согласия в качестве меры расхождения статистического и теоретического законов распределения принимают различные величины. В критерии согласия Пирсона (критерий χ2) за меру расхождения принимается величина χ2, опытное значение При Значения вероятностей Для применения критерия согласия Пирсона в общем случае необходимо, чтобы объем выборки n и численность разрядов Рассмотрим суть критерия Предположим, что на основе приведенного выше распределения выдвинута гипотеза Н: генеральная совокупность имеет нормальное распределение. Для вычисления выравнивающих частот поступают следующим образом: 1. Находят значения 2. Выравнивающие частоты В результате получено множество выравнивающих частот Обозначим через Для данной выборке по этой формуле находим значение случайной величины Теперь проверка гипотезы Н проводится следующим образом: задаемся уровнем значимости р, т. е. столь малой вероятностью р, при которой о событии Если каждому значению одной случайной величины соответствует значение другой, то случайные величины связаны функциональной зависимостью. Однако такая строгая зависимость реализуется весьма редко, т.к. очень часто оба признака (или один из них) подвержены еще действиям случайных факторов, причем среди этих факторов могут быть и общие для обоих признаков. В этом случае и возникает другой вид зависимости – корреляционная зависимость. Определение 1. Две случайные величины Х и Y находятся в корреляционной зависимости, если каждому значению любой из этих величин соответствует определенное распределение вероятностей другой величины. Определение 2. Условным математическим ожиданием дискретной случайной величины Х при Y=y (у-определенное возможное значение Y) называют сумму произведений возможных значений величины Х на их условные вероятности: Для непрерывных величин Условное математическое ожидание Корреляционная зависимость проявляется в том, что при изменении одной величины, изменяется условное математическое другой. Аналогично определяется условное математическое ожидание случайной величины Y и функция регрессии Y на Х: Уравнение Линия регрессии Y на Х (Х на Y) показывает, как в среднем зависит Y от Х (Х от Y). Для характеристики корреляционной зависимости между случайными величинами вводится понятие коэффициента корреляции. Определение 1. Если Х и Y- независимые случайные величины, то Если же Х и Y не являются независимыми случайными величинами, то За меру связи (зависимости) двух случайных величин Х и Y приминают безразмерную величину r, определяемую соотношением: При этом Определение 2. Случайные величины Х и Y называют некоррелированными, если r=0, и коррелированными, если
Свойства коэффициента корреляции:
1. Если Х и Y- независимые случайные величины, то коэффициент корреляции равен нулю. 2. Коэффициент корреляции по абсолютной величине не превышает единицы, т.е. 3. Коэффициент корреляции характеризует относительную величину отклонения математического ожидания произведения Определение. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии Выведем уравнение прямой линии регрессии Y на Х, т. е. найдем коэффициент линейной функции Обозначим
Полученный коэффициент называют коэффициентом регрессии Y на Х и обозначают Таким образом, уравнение прямой регрессии Y на Х имеет вид Уравнения прямых регрессии можно записать в более симметричном виде, если воспользоваться коэффициентом корреляции: Из уравнений прямых регрессии видно, что обе эти прямые проходят через точку Так как При Коэффициенты регрессии имеют тот же знак, что и коэффициент корреляции r, и связаны соотношением:
Популярное: Почему стероиды повышают давление?: Основных причин три... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... ![]() ©2015-2024 megaobuchalka.com Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (705)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |