Статистический анализ выборочной совокупности
Выборочной совокупностью, или просто выборкой, называют совокупность случайно отобранных объектов. Объемом n выборочной совокупности называют число объектов этой совокупности. Интервальным статистическим распределением выборки называют перечень интервалов и соответствующих им частот ni или относительных частот Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению Для распределения наблюдений по интервалам необходимо найти длину интервала h, определяемую как отношение разности между максимальным Xmaх и минимальным Xmin элементами выборки к количеству интервалов k
Количество интервалов k (целое число) целесообразно выбрать не менее 7, но и не более 15 или определить по формуле Старджесса
где n – объем выборки. Если k, вычисляемое по формуле Старджесса, нецелое число, то в качестве числа интервалов можно ближайшее к k целое число, не меньшее k. Статистические оценки параметров распределения Выборочной средней
Если значения признака х1, х2, …., хk имеют соответственно частоты n1, n2, …..nk, причем n1+n2+……+nk=n, то
Для характеристики рассеяния значений количественного признака Х выборки вокруг своего среднего значения вводят такой параметр как выборочная дисперсия. Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения
Если значения признака х1, х2, …., хk имеют соответственно частоты n1, n2, …..nk, причем n1+n2+……+nk=n, то
Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии:
Начальный эмпирический момент
где xi – наблюдаемое значение признака, ni – частота наблюдаемого значения признака, n – объем выборки. Начальный эмпирический момент первого порядка равен выборочной средней Центральный эмпирический момент
Центральный эмпирический момент второго порядка равен выборочной дисперсии Коэффициент асимметрии
Эксцесс
Относительной характеристикой рассеивания случайной величины выступает коэффициент вариации V, который вычисляется как отношение среднего квадратического отклонения и выборочной средней по формуле
Метод моментов Метод моментов – это определение неизвестных параметров статистического распределения путем приравнивания теоретических моментов рассматриваемого распределения соответствующим эмпирическим моментам того же порядка. Для нахождения параметра λ показательного распределения необходимо приравнять начальный момент первого порядка показательного распределения начальному моменту первого порядка эмпирического распределения:
Для нахождения параметров а и σ нормального распределения необходимо: 1) приравнять начальный момент первого порядка нормального распределения к начальному моменту первого порядка эмпирического распределения:
2) центральный момент второго порядка нормального распределения к центральному моменту второго порядка эмпирического распределения:
Для нахождения параметров a и b равномерного распределениянеобходимо: 1) приравнять начальный момент первого порядка равномерного распределения к начальному моменту первого порядка эмпирического распределения:
2) центральный момент второго порядка равномерного распределения к центральному моменту второго порядка эмпирического распределения:
Параметры равномерного распределения a и b можно определить по формулам
Начальные эмпирические моменты третьего Центральные эмпирические моменты третьего Проверка статистических гипотез Установление закона распределения выборочной совокупности проводится через проверку статистических гипотез. Статистической называют гипотезу о виде неизвестного распределения. Статистические гипотезы бывают двух видов: нулевая (выдвигаемая) гипотеза Н0и конкурирующая (противоречащая нулевой) Н1. Проведение проверки статистическими методами приводит к появлению ошибок двух родов: 1) ошибка первого рода – отвержение правильной гипотезы; 2) ошибка второго рода – принятие неправильной гипотезы. Вероятность совершить ошибку первого рода называют уровнем значимости и обозначают через α. Наиболее часто уровень значимости принимают 0,05, что означает наличие риска отвергнуть правильную гипотезу в пяти случаях из ста. Для проверки нулевой гипотезы используется специально подобранная случайная величина, которая называется статистическим критерием. Наблюдаемым значением критерия называют его значение, вычисленное по выборке. После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается. Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезыназывают совокупность значений критерия, при которых нулевую гипотезу принимают. Критической точкой называют точку, отделяющую критическую область от области принятия гипотезы. Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку. Основной принцип проверки статистических гипотез формулируется следующим образом: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают. Для проверки гипотезы о закономерности распределения выборочной совокупности применяется критерий Пирсона Нулевую гипотезу следует принимать, если наблюдаемое значение критерия Пирсона меньше значения критической точки Для вычисления наблюдаемого значения критерия Пирсона
где k – количество интервалов. Эмпирическая частота
где Рi – вероятность попадания случайной величины Х теоретического распределения в частичный интервал Выбор теоретического распределения определяется примерным совпадением вида гистограммы относительных частот статистического распределения с графиком плотности соответствующего распределения случайной величины Х (рис. 1, 2, 3). Результатом проведенного сравнительного анализа выступает выдвижение гипотезы о виде распределения выборочной совокупности и ее последующая проверка. Для подтверждения выдвигаемой гипотезы сравниваются: 1) коэффициент асимметрии 2) эксцесс 3) коэффициент вариации V статистического распределения с коэффициентами вариации показательного (
Популярное: Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... ![]() ©2015-2024 megaobuchalka.com Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (251)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |