Цепь Маркова с частичными связями и переменным шаблоном

2016-09-16

386

Обсуждений (0)

0.00 из 5.00 0 оценок

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ

Кафедра математического моделирования и анализа данных

ЦЕПЬ МАРКОВА С ЧАСТИЧНЫМИ СВЯЗЯМИ И ПЕРЕМЕННЫМ ШАБЛОНОМ

Курсовая работа

Батуры Олега Владимировича

студента 4 курса,

специальность

«Компьютерная безопасность»

Научный руководитель:

доктор физ.-мат. наук,

заведующий кафедрой ММАД

Ю. С. Харин

Минск, 2016

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ ПРИКЛАДНОЙ математики и информатики

Кафедра математического моделирования и анализа данных

ЗАДАНИЕ НА КУРСОВУЮ РАБОТУ

Студент Батура Олег Владимирович, 4 курс, 9 группа

1. Тема работы Цепь Маркова с частичными связями и переменным шаблоном

2. Срок сдачи студентом законченной работы________ 2016 г.

3.Перечень вопросов, подлежащих разработке

· Исследовать вероятностные характеристики модели цепи Маркова с частичными связями и переменным шаблоном. Найти -мерное распределение вероятностей .

· Построить компьютерную модель ЦМ с переменным шаблоном.

· Построить статистические оценки параметров модели при известной функции шаблона , исследовать свойства оценок.

· Построить оценки параметров модели при периодически изменяющемся, но неизвестном шаблоне.

Руководитель курсовой работы____________ / Ю. С. Харин/ ______ 2016 г.

Задание принял к исполнению____________ 2016 г.

СОДЕРЖАНИЕ

Введение. 4

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ.. 5

1.1 Цепь Маркова с частичными связями и переменным шаблоном.. 5

1.2 Статистическое оценивание параметров ЦМ с переменным шаблоном.. 6

1.3 Алгоритмы вычисления оценки шаблона . 10

1.4 Алгоритмы вычисления оценки функции . 12

2.ПРАКТИЧЕСКАЯ ЧАСТЬ.. 13

2.1.Описание программы.. 13

2.2.Моделирование временного ряда длительности .. 14

2.3.Построение оценок максимального правдоподобия и . 15

2.4.Результаты экспериментов. 18

2.5.Вывод. 21

Заключение. 22

Список использованной литературы.. 23

Введение

При математическом моделировании сложных систем и процессов в различных научных сферах часто возникает необходимость построения вероятностно-статистических моделей дискретных временных рядов , где пространство состояний — конечное множество мощности с длинной памятью [1]. Известной моделью таких дискретных временных рядов является цепь Маркова достаточно высокого порядка , определяющего длину памяти; если , то цепь Маркова называется простой, если — сложной. Однако для такой модели число параметров растет экспоненциально при увеличении порядка : , и для статистического оценивания параметров требуется иметь реализацию не всегда доступной на практике длительности . В связи с этим актуальна проблема построения малопараметрических моделей цепей Маркова высокого порядка. В данной работе исследуется малопараметрическая модель цепи Маркова порядка с частичными связями ЦМ , рассмотренная в [2], для которой шаблон связей зависит от функции, определяющей его изменение во времени, исследуются ее вероятностные характеристики, строятся статистические оценки параметров модели.

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

Цепь Маркова с частичными связями и переменным шаблоном

По аналогии с [2] построим модель цепи Маркова с частичными связями и переменным шаблоном.

Пусть – однородная ЦМ( ), заданная на вероятностном пространстве ( ). Рассмотрим обобщение данной модели, когда шаблон зависит от времени :

причем:

В общем случае шаблон зависит от некоторой функции , определяющей его изменение. Простейшая модель такой зависимости – периодическая функция с некоторым периодом :

При произвольной модели зависимости шаблона от времени -мерное распределение вероятностей имеет вид:

Лемма 1.Случайная последовательность является неоднородной ЦМ порядка с частичными связями и -мерной матрицей вероятностей одношаговых переходов в момент времени

1.2 Статистическое оценивание параметров ЦМ с переменным шаблоном

Для статистического оценивания параметров ЦМ( ) с переменным шаблоном будем пользоваться методом максимального правдоподобия.

Рассмотрим задачу построения оценок максимального правдоподобия (ОМП) для параметров шаблона и стохастической матрицы по наблюдаемой реализации длительности .

Введем обозначения, пусть – мультииндекс -го порядка; – функция, которую условимся называть селектором -го порядка с параметрами и – индикатор события ; – начальное -мерное распределение вероятностей ЦМ ;

– частота -граммы для шаблона , удовлетворяющая условию нормировки:

Лемма 2.Для модели ЦМ с переменным шаблоном логарифмическая функция правдоподобия имеет вид:

В частности, когда имеется лишь 2 возможных шаблона связей , а закон изменения шаблона во времени задается некоторой функцией , то есть , логарифмическая функция правдоподобия запишется в виде

Для того, чтобы найти ОМП для матрицы при известной функции шаблона , необходимо решить задачу на условный экстремум:

В результате получаем условную ОМП для матрицы ( ):

Далее рассмотрим задачу построения ОМП для шаблона при известной функции смены шаблона такой, что .

Пусть существует стационарное распределение вероятностей ЦМ с переменным шаблоном . Допустим, что модель стационарна ( ), тогда распределение вероятностей -граммы в момент времени для шаблона будет иметь следующий вид:

Соответствующая частотная оценка вероятностей :

Энтропия -мерного распределения вероятностей запишется в виде:

Количество информации по Шеннону, содержащейся в -грамме о будущем символе :

С учетом принятых обозначений логарифмическая функция правдоподобия для оценки имеет следующий вид:

где – подстановочная оценка энтропии, получающаяся при подстановке вместо истинных значений их оценок { }.

Учитывая, что не зависит от , добавляя также не зависящее от слагаемое , а также используя тот факт, что:

приходим к следующей ОМП шаблона :

где – подстановочная оценка количества информации по Шеннону, получающаяся при подстановке вместо истинных значений их оценок { }.

Пусть – некоторый класс функций, которому принадлежит функция изменения шаблона во времени. Предположим, что все возможные значения шаблона известны. Тогда ОМП функции выглядит следующим образом:

1.3 Алгоритмы вычисления оценки шаблона

Для вычисления оценки шаблона при известном истинном значении числа связей и функции изменения шаблона во времени аналогично [2] предлагаются два алгоритма: алгоритм А1 полного перебора значений целевой функции ОМП шаблона и алгоритм А2 наращивания шаблона, обеспечивающий сокращение перебора. В случае, когда известно с точностью до числового промежутка: , для совместного оценивания , предлагается алгоритм А3 сокращения шаблона.

При описании алгоритмов А2, А3 мы используем вспомогательные обозначения. Для некоторого шаблона -го порядка , обозначим через подмножество всевозможных шаблонов -го порядка, получающихся вставкой в строку одного из новых символов ; символ вставляется так, чтобы новая строка символов обладала свойством шаблона: . Аналогично, через обозначим подмножество всевозможных шаблонов -го порядка, которые получаются вычеркиванием одного из символов за исключением первого.

Алгоритм А2 наращивания шаблона заключается в последовательном вычислении шаблонов , где – наименьший размер шаблона, задаваемый исходя из имеющихся вычислительных ресурсов. Вначале при алгоритмом А1 вычисляется начальный шаблон порядка ; затем осуществляется наращивание этого шаблона в зависимости от функции его изменения по рекуррентной формуле

Наибольшее быстродействие алгоритма А2, очевидно, достигается при . Этот подход аналогичен алгоритму расширения пространства признаков в задачах распознавания образов, который, как известно, может приводить к потере истинной гипотезы.

Алгоритм А3 базируется на очевидном свойстве вложенности моделей цепей Маркова:

в силу которого шаблон связей содержит . Вначале при алгоритмом А1 вычисляется начальный шаблон порядка ; затем

осуществляется сокращение этого шаблона по рекуррентной формуле

Затем на основе { } строится искомая оценка , где

1.4 Алгоритмы вычисления оценки функции

Для вычисления оценки функции изменения шаблона во времени при известных истинных значениях шаблона предлагаются три алгоритма в зависимости от информации о данной функции.

1. Если принадлежит некоторому конечному классу , а также известно, что данная функция – периодическая с заранее известным периодом , предлагается алгоритм полного перебора значений целевой функции ОМП функции изменения шаблона.

2. Если принадлежит некоторому конечному классу , периодическая, и ее период не превосходит некоторого наперед заданного порогового значения , предлагается алгоритм полного перебора , значений целевой функции.

3. Дискретная функция известна с точностью до параметра:

где – некоторый неизвестный -вектор параметров, . Предлагается алгоритм полного перебора всех возможных значений данного вектора, которые принадлежат .

ПРАКТИЧЕСКАЯ ЧАСТЬ

Описание программы

Построена компьютерная модель цепи Маркова с частичными связями и переменным шаблоном со следующими входными параметрами:

· глубина предыстории однородной цепи Маркова ЦМ .

· длина временного ряда с пространством состояний .

· Шаблоны и , которые повторяются с периодом

· Стохастическая матрица вероятностей одношаговых переходов для шаблонов:

В частном случае, при данная матрица имеет следующий вид:

Реализовано моделирование цепи Маркова с частичными связями и переменным шаблоном, построение оценок максимального правдоподобия матрицы вероятностей одношаговых переходов и переменного шаблона на основе смоделированного временного ряда. Далее более подробно рассматривается алгоритм работы программы.

2.2. Моделирование временного ряда длительности

Пользователем задаются первые элементов последовательности. Для моделирования элементов с нечетными номерами выбирается шаблон . Рассматривается -предыстория элемента. Распределениями вероятностей исхода для данных элементов являются строки матрицы , соответствующие состояниям предыдущих элементов

В частности, если предыстория элемента имеет вид

то, например, при

Элементы с четными номерами моделируются аналогичным образом с использованием шаблона

На каждом шаге моделирование происходит с помощью генератора псевдослучайных чисел [3], работающего по следующему алгоритму:

1. Генерируется число в диапазоне .

В результате имеется временной ряд , где пространство состояний – конечное множество мощности .

2.3. Построение оценок максимального правдоподобия и

Логарифмическая функция правдоподобия имеет вид:

Задача на условный экстремум:

Поиск условной оценки максимального правдоподобия матрицы одношаговых переходов осуществляется путем приравнивания к нулю компонент градиента логарифмической функции правдоподобия:

Используя факт, что матрица стохастическая,

, условная оценка полностью определяется шаблоном

Для вычисления оценки шаблона при известном истинном значении числа связей можно воспользоваться алгоритмом полного перебора значений логарифмической функции правдоподобия.

В частности, при имеется следующая система уравнений:

где частота выпадения при предыстории .

Условной оценкой максимального правдоподобия является решение данной системы:

Логарифмическая функция правдоподобия перепишется в следующей форме:

Оценка максимального правдоподобия ищется путем перебора вариантов шаблонов. Производится подсчет частот при всевозможных вариантах пар шаблонов и выбирается та пара, которая максимизирует логарифмическую функцию правдоподобия. Таким образом:

Оценка максимального правдоподобия матрицы имеет вид:

2016-09-16

386

Обсуждений (0)

0.00 из 5.00 0 оценок

Обсуждение в статье: Цепь Маркова с частичными связями и переменным шаблоном

Обсуждений еще не было, будьте первым... ↓↓↓