МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ
Кафедра математического моделирования и анализа данных
ЦЕПЬ МАРКОВА С ЧАСТИЧНЫМИ СВЯЗЯМИ И ПЕРЕМЕННЫМ ШАБЛОНОМ
Курсовая работа
Батуры Олега Владимировича
студента 4 курса,
специальность
«Компьютерная безопасность»
Научный руководитель:
доктор физ.-мат. наук,
заведующий кафедрой ММАД
Ю. С. Харин
Минск, 2016
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ПРИКЛАДНОЙ математики и информатики
Кафедра математического моделирования и анализа данных
ЗАДАНИЕ НА КУРСОВУЮ РАБОТУ
Студент Батура Олег Владимирович, 4 курс, 9 группа
1. Тема работы Цепь Маркова с частичными связями и переменным шаблоном
2. Срок сдачи студентом законченной работы________ 2016 г.
3.Перечень вопросов, подлежащих разработке
· Исследовать вероятностные характеристики модели цепи Маркова с частичными связями и переменным шаблоном. Найти
-мерное распределение вероятностей
.
· Построить компьютерную модель ЦМ
с переменным шаблоном.
· Построить статистические оценки параметров модели при известной функции шаблона
, исследовать свойства оценок.
· Построить оценки параметров модели при периодически изменяющемся, но неизвестном шаблоне.
Руководитель курсовой работы____________ / Ю. С. Харин/ ______ 2016 г.
Задание принял к исполнению____________ 2016 г.
СОДЕРЖАНИЕ
Введение. 4
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ.. 5
1.1 Цепь Маркова с частичными связями и переменным шаблоном.. 5
1.2 Статистическое оценивание параметров ЦМ
с переменным шаблоном.. 6
1.3 Алгоритмы вычисления оценки шаблона
. 10
1.4 Алгоритмы вычисления оценки функции
. 12
2.ПРАКТИЧЕСКАЯ ЧАСТЬ.. 13
2.1.Описание программы.. 13
2.2.Моделирование временного ряда длительности
.. 14
2.3.Построение оценок максимального правдоподобия
и
. 15
2.4.Результаты экспериментов. 18
2.5.Вывод. 21
Заключение. 22
Список использованной литературы.. 23
Введение
При математическом моделировании сложных систем и процессов в различных научных сферах часто возникает необходимость построения вероятностно-статистических моделей дискретных временных рядов
, где пространство состояний
— конечное множество мощности
с длинной памятью [1]. Известной моделью таких дискретных временных рядов является цепь Маркова достаточно высокого порядка
, определяющего длину памяти; если
, то цепь Маркова называется простой, если
— сложной. Однако для такой модели число параметров
растет экспоненциально при увеличении порядка
:
, и для статистического оценивания параметров требуется иметь реализацию
не всегда доступной на практике длительности
. В связи с этим актуальна проблема построения малопараметрических моделей цепей Маркова высокого порядка. В данной работе исследуется малопараметрическая модель цепи Маркова порядка
с
частичными связями ЦМ
, рассмотренная в [2], для которой шаблон связей
зависит от функции, определяющей его изменение во времени, исследуются ее вероятностные характеристики, строятся статистические оценки параметров модели.
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
Цепь Маркова с частичными связями и переменным шаблоном
По аналогии с [2] построим модель цепи Маркова с частичными связями и переменным шаблоном.
Пусть
– однородная ЦМ(
), заданная на вероятностном пространстве (
). Рассмотрим обобщение данной модели, когда шаблон
зависит от времени
:

причем:
В общем случае шаблон зависит от некоторой функции
, определяющей его изменение. Простейшая модель такой зависимости – периодическая функция с некоторым периодом
:
.
При произвольной модели зависимости шаблона от времени
-мерное распределение вероятностей имеет вид:


Лемма 1.Случайная последовательность
является неоднородной ЦМ порядка
с частичными связями и
-мерной матрицей вероятностей одношаговых переходов в момент времени


1.2 Статистическое оценивание параметров ЦМ
с переменным шаблоном
Для статистического оценивания параметров ЦМ(
) с переменным шаблоном будем пользоваться методом максимального правдоподобия.
Рассмотрим задачу построения оценок максимального правдоподобия (ОМП) для параметров
шаблона
и
стохастической матрицы
по наблюдаемой реализации
длительности
.
Введем обозначения, пусть
– мультииндекс
-го порядка;
– функция, которую условимся называть селектором
-го порядка с параметрами
и
– индикатор события
;
– начальное
-мерное распределение вероятностей ЦМ
;
– частота
-граммы
для шаблона
, удовлетворяющая условию нормировки:
Лемма 2.Для модели ЦМ
с переменным шаблоном логарифмическая функция правдоподобия имеет вид:
В частности, когда имеется лишь 2 возможных шаблона связей
, а закон изменения шаблона во времени задается некоторой функцией
, то есть
, логарифмическая функция правдоподобия запишется в виде

Для того, чтобы найти ОМП для матрицы
при известной функции шаблона
, необходимо решить задачу на условный экстремум:


В результате получаем условную ОМП для матрицы
(
):

Далее рассмотрим задачу построения ОМП для шаблона
при известной функции смены шаблона
такой, что
.
Пусть существует стационарное распределение вероятностей ЦМ
с переменным шаблоном
. Допустим, что модель стационарна (
), тогда распределение вероятностей
-граммы в момент времени
для шаблона
будет иметь следующий вид:

Соответствующая частотная оценка вероятностей
:
.
Энтропия
-мерного распределения вероятностей запишется в виде:

Количество информации по Шеннону, содержащейся в
-грамме
о будущем символе
:

С учетом принятых обозначений логарифмическая функция правдоподобия для оценки имеет следующий вид:

где
– подстановочная оценка энтропии, получающаяся при подстановке вместо истинных значений
их оценок {
}.
Учитывая, что
не зависит от
, добавляя также не зависящее от
слагаемое
, а также используя тот факт, что:
приходим к следующей ОМП шаблона
:

где
– подстановочная оценка количества информации по Шеннону, получающаяся при подстановке вместо истинных значений
их оценок {
}.
Пусть
– некоторый класс функций, которому принадлежит функция
изменения шаблона во времени. Предположим, что все возможные значения шаблона известны. Тогда ОМП функции
выглядит следующим образом:
1.3 Алгоритмы вычисления оценки шаблона 
Для вычисления оценки
шаблона
при известном истинном значении
числа связей
и функции изменения шаблона во времени
аналогично [2] предлагаются два алгоритма: алгоритм А1 полного перебора значений целевой функции ОМП шаблона и алгоритм А2 наращивания шаблона, обеспечивающий сокращение перебора. В случае, когда
известно с точностью до числового промежутка:
, для совместного оценивания
,
предлагается алгоритм А3 сокращения шаблона.
При описании алгоритмов А2, А3 мы используем вспомогательные обозначения. Для некоторого шаблона
-го порядка
, обозначим через
подмножество
всевозможных шаблонов
-го порядка, получающихся вставкой в строку
одного из новых символов
; символ вставляется так, чтобы новая строка символов
обладала свойством шаблона:
. Аналогично, через
обозначим подмножество
всевозможных шаблонов
-го порядка, которые получаются вычеркиванием одного из символов
за исключением первого.
Алгоритм А2 наращивания шаблона заключается в последовательном вычислении шаблонов
, где
– наименьший размер шаблона, задаваемый исходя из имеющихся вычислительных ресурсов. Вначале при
алгоритмом А1 вычисляется начальный шаблон
порядка
; затем осуществляется наращивание этого шаблона в зависимости от функции его изменения по рекуррентной формуле

Наибольшее быстродействие алгоритма А2, очевидно, достигается при
. Этот подход аналогичен алгоритму расширения пространства признаков в задачах распознавания образов, который, как известно, может приводить к потере истинной гипотезы.
Алгоритм А3 базируется на очевидном свойстве вложенности моделей цепей Маркова:
в силу которого шаблон связей
содержит
. Вначале при
алгоритмом А1 вычисляется начальный шаблон
порядка
; затем
осуществляется сокращение этого шаблона по рекуррентной формуле

Затем на основе {
} строится искомая оценка
, где

1.4 Алгоритмы вычисления оценки функции 
Для вычисления оценки функции изменения шаблона во времени
при известных
истинных значениях шаблона
предлагаются три алгоритма в зависимости от информации о данной функции.
1. Если
принадлежит некоторому конечному классу
, а также известно, что данная функция – периодическая с заранее известным периодом
, предлагается алгоритм полного перебора
значений целевой функции ОМП функции изменения шаблона.
2. Если
принадлежит некоторому конечному классу
, периодическая, и ее период
не превосходит некоторого наперед заданного порогового значения
, предлагается алгоритм полного перебора
,
значений целевой функции.
3. Дискретная функция
известна с точностью до параметра:

где
– некоторый неизвестный
-вектор параметров,
. Предлагается алгоритм полного перебора всех возможных значений данного вектора, которые принадлежат
.
ПРАКТИЧЕСКАЯ ЧАСТЬ
Описание программы
Построена компьютерная модель цепи Маркова с частичными связями и переменным шаблоном со следующими входными параметрами:
·
глубина предыстории однородной цепи Маркова ЦМ
.
·
длина временного ряда с пространством состояний
.
· Шаблоны
и
, которые повторяются с периодом 

· Стохастическая матрица вероятностей одношаговых переходов для шаблонов:

В частном случае, при
данная матрица имеет следующий вид:

Реализовано моделирование цепи Маркова с частичными связями и переменным шаблоном, построение оценок максимального правдоподобия матрицы вероятностей одношаговых переходов
и переменного шаблона
на основе смоделированного временного ряда. Далее более подробно рассматривается алгоритм работы программы.
2.2. Моделирование временного ряда длительности 
Пользователем задаются первые
элементов последовательности. Для моделирования элементов
с нечетными номерами
выбирается шаблон
. Рассматривается
-предыстория элемента. Распределениями вероятностей исхода для данных элементов являются строки матрицы
, соответствующие состояниям предыдущих элементов
В частности, если предыстория элемента
имеет вид
,
то, например, при 

Элементы
с четными номерами
моделируются аналогичным образом с использованием шаблона 
На каждом шаге моделирование происходит с помощью генератора псевдослучайных чисел [3], работающего по следующему алгоритму:
1. Генерируется число
в диапазоне
.
2. 
В результате имеется временной ряд
, где пространство состояний
– конечное множество мощности
.
2.3. Построение оценок максимального правдоподобия
и 
Логарифмическая функция правдоподобия имеет вид:

Задача на условный экстремум:


Поиск условной оценки максимального правдоподобия матрицы одношаговых переходов
осуществляется путем приравнивания к нулю компонент градиента логарифмической функции правдоподобия:

Используя факт, что матрица
стохастическая, 
, условная оценка
полностью определяется шаблоном 
Для вычисления оценки
шаблона
при известном истинном значении числа связей
можно воспользоваться алгоритмом полного перебора
значений логарифмической функции правдоподобия.
В частности, при
имеется следующая система уравнений:
где
частота выпадения
при предыстории
.
Условной оценкой максимального правдоподобия
является решение данной системы:
.
Логарифмическая функция правдоподобия перепишется в следующей форме:



Оценка максимального правдоподобия
ищется путем перебора
вариантов шаблонов. Производится подсчет частот
при всевозможных вариантах пар шаблонов и выбирается та пара, которая максимизирует логарифмическую функцию правдоподобия. Таким образом:

Оценка максимального правдоподобия матрицы
имеет вид: