Критерий Лапласа относительно выигрыша/риска
Если нет информации о вероятностях состояния природы, то все состояния природы считаются равновероятными: Все критерии Лапласа являются частными случаями соответствующих критериев Байеса.
которое можно переписать так :
или так:
Под paccтоянием
Eсли точка
то неравенство Taк как
то из левого неравенства (2.21.29) получим:
B частности последнее неравенство будет выполняться для того номера j, который доставляет функции
Из этого неравенства и правого неравенства (2.21.29) будем иметь:
В частности, справедливы неравенства которые можно переписать следующим образом :
или
Taким o6paзом, mы noказали, что для любого Доказательство непрерывности на множестве SA функции M(P) проводиться аналогично, в силу непрерывности функции H(P, nj) пo apryментy P нa мнoжестве SA, для любого Так как это неравенство верно для любого j = 1,..., n, to, b частности, имеем Отсюда и из левого неравенства (2.21.29) получим : Поскольку полученное неравенство имеет место для каждого j = 1,..., n, to справедливо неравенство из котoporo вытекает неравенство Этим доказана непрерывность функции M(P) нa множестве SA. Из Heпpepывности функций W(P) h M(P) следует нeпpepывность функции Taк кaк мнoжество SA является симплексом (cm. § 2.7), то oho замкнуто и ограничено (o6ocновaние этого факта cm. b доказательстве теоремы 2.8.1). Следовательно, по теореме Вейерштрасса [6. C. 274], нeпpepывная функция При Toгда, кaк следует из (2.21.28), onmuмальной cpeди вcex взвешанных cmpameгий множества SA no критерию Вальда 6yдет cтратегия При Cлeдовaтельно, из (2.21.28) получаем, что oптuмальной среди всех смешанных стратегий множества SA по максимальному критерию является стратегия Относительно максимального критерия справедлива следующая Teopeмa 2.21.1. Стратегия Доказательство: Пусть P = (p1,..., pm) — произвольная смешанная стратегия игрока А. Тогда для её показателя эффективности M(P) пo мaксимаксному критерию, в силу (2.21.26), нормировочного равенства Taк кaк пpaвaя часть этого неравенства не зависит от P, то
C другой стороны, для чистой стратегии
Из неравенств (2.21.33) h (2.21.32) получаем:
т.e.
Этo paвeнство означает, по определению, что чистая стратегия Teopeмa 2.21.1говорит о том, что при применении максимального критерия, нет необходимости пользоваться смешанными стратегиями, а для отыскания оптимального решения достаточны лишь чистые стратегии. Аналогичная теорема для критерия Вальда не верна, т.е. среди смешанных стратегий игрока А, не являющихся чистыми, может оказаться стратегия с более высокой эффективностью, чем эффективность любой чистой стратегии. Приведём простой пример, подтверждающий это утверждение. Пример 2.21.1.Рассмотрим игру с природой, задаваемой матрицей выигрышей Табл.(2.21.34)
Переставив элементы в первой строке матрицы (2.21.34), получим матрицу (2.21.35) : Табл. (2.21.35)
Найдём чистою стратегию, оптимальную по критерию Вальда среди чистых стратегий. Из первого столбца матрицы (2.21.35) имеем показатели эффективности стратегий A1 и А2, равные соответственно W1=2 и W2=1. Тогда максимин W=max{2,1}=2= W1 и потому, оптимальной среди чистых будет стратегия A1, гарантирующая выигрыш, не меньше показателя её эффективности W1=2. Пусть P=(p1, p2) — произвольная смешанная стратегия из множества SA. Если обозначить p1 = p, то, в силу нормировочного равенства p1+ p2 =1, будем иметь: p2=1-p и, следовательно стратегию P можно переписать так: P = (p,l-p), Следовательно показатель эффективности стратегии P будет иметь следующий вид: W(P) = min{H(P,nl), H(P,n2)}= min{3p +1, -5p + 7}. Ha pис. 2.21.1 изображены графики выигрышей H(P, П1), H(P, П2) как функций аргумента Для того чтобы показатель эффективности W(P) был больше 2 : W(P)>2, нeo6ходимо и достаточно, чтобы
Решая эту систему неравенств, получим: Таким образом, показатель эффективности смешанной стратегии P(p,1-p), определяемой любой вероятностью Puc 2.21.1-------------------------------- Найдём смешанную стратегию Так как по определению стратегии P0, оптимальной среди всех смешанных стратегий множества по критерию Вальда. W(P°)=maxW(P), то оптимальная стратегия P0 находиться во множестве {P=(p, l-p) : 3p+1=-5p+7. Решением является p° = 3/4. Таким образом, смешанная стратегия P°= (3/4, ¼) является оптимальной среди всех смешанных стратегий множества SA по критерию Вальда с наибольшим показателем эффективности
Оптимальной по критерию Вальда стратегия P°= (3/4, ¼) среди всех смешанных стратегий множества SA гарантирует игроку A при любых состояниях природы выигрыш, не меньший, чем 3'/4, в то время как чистая стратегия Al, оптимальной по тому же критерию среди чистых стратегий, гарантировала выигрыш, не меньший всего лишь 2. Paccмотpeнный o6o6щенный критерий Гурвица и его чистые случаи были сформулированы так, что они существенно учитывали выигрыши игрока A и потому являлись критериями «относительно выигрышей». Однако можно сформулировать аналогичные критерии относительно рисков. В соответствии с определением риска(2.19.5) составим матрицу рисков для матрицывыигрышей(2.20.1):
(2.21.36) Обобщённый критерий пессимизма-оптимизма Гурвица относительно рисков с коэффициентами В каждой строке матрицы (21.36) переставим риски в невозрастающем порядке и обозначим элементы полученной матрицы через D =
Таким o6paзом, В силу этого, в первом столбце матрицы D стоят максимальные риски при каждой стратегии Ai: a в последнем n — м столбце — минимальные риски при каждой стратегии Ai:
Отметим что если i—я строка матрицы выигрышей (20.1) содержит максимальный выигрыш Пусть числа Показатели неэффективности стратегии Ai по обобщенному критерию Гурвица относительно рисков с коэффициентами
учитывающее очевидно все риски при выборе стратегии Ai. Обобщенным критерием пессимизма – оптимизма Гурвица относительно рисков с коэффициентами
Числа Коэффициенты Впрочем, коэффициенты
- сумма рисков j-го столбца матрицы D;
-среднее значение рисков j-го столбца матрицы D; - сумма всех рисков матрицы D [или, что тоже, -матрицы (2.21.36)]. Из (2.21.37) имеем: В опасной ситуации коэффициенты откуда [cm. (2.21.21)] В случае безопасной ситуации коэффициенты откуда [cm. (2.21.2)]
Рассмотрим частные случаи обобщенного критерия пессимизма – оптимизмаГурвица относительно рисков с коэффициентами Если Поэтому из (2.20.11) и (2.21.41) следует, что обобщенный критерий Гурвица относительно рисков превращается в этом случае в критерий Байеса относительно рисков. Если коэффициенты
Поскольку di1 ,..., din является перестановкой рисковri1,…, rin - строки матрицы (2.21.36), то
и тогда из (2.21.42): т.e. показатель неэффективности стратегии Ai по обобщенному критерию Гурвица относительно рисков превращается в показатель неэффективности стратегии Ai по критерию Лапласа относительно рисков (cm. § 2.20). таким образом, в этом случае обобщенный критерий Гурвица относительно рисков превращается, как это следует из (2.21.41), в критерий Лапласа относительно рисков. Kpumepuu Cэвиджa (кpumepuu кpaйнего neccuмизмa). Kpumepuu Cэвиджaпредставляет собой частный случай обобщенного критерия Гурвица относительно рисков с коэффициентами (2.21.7). Из (2.21.40), (2.21.7) и (2.21.38) получаем показатель неэффективности стратегии Ai no Kpumepuю Cэвиджa :
представляющий собой максимальный риск при выборе игроком A стратегии Ai. Onmuмальной cpeдu чистых cmpameгuй no кpumepuю Cэвиджa является в соответствии с формулой (2.21.41) cmpameгия
Таким образом, оптимальной среди чистых стратегий по критерию Cэвиджa считается та чистая стратегия, максимальный риск при выборе которой является минимальным среди максимальных рисков всех чистых стратегий. Поэтому оптимальная стратегия по критерию Cэвиджa гарантирует игроку A при любых состояниях природы риск, не больший, чем минимакс
Из (2.21.7) h (2.21.6) находим, что для критерия Cэвиджa показатель пессимизма Хотя и критерий Вальда, и критерий Cэвиджa являются критериями крайнего пессимизма, но они не эквивалентны. Для доказательства этого вернемся к примеру 2.23.2. IIpимер 2.21.3. B IIpимере мы показали, что оптимальной (среди чистых стратегий) по критерию Вальда является стратегия A1. Найдём оптимальную стратегию по критерию. Перепишем матрицу игры (2.21.24), дополнив её строкой максимальных выигрышей
По этой матрице составим матрицу выигрышей (2.21.34):
(2.21.44) Переставив элементы первой строки этой матрицы, получим матрицу
(2.21.45) В первом столбце матрицы (2.21.45) стоят показатели неэффективности стратегий A1 и A2: R1(1,0)=5, R2(l,0)=3. Поэтому min{R1(1,0), R2(l,0)}= min{5; 3}=3 =R2(1,0)
и, следовательно, оптимальной по критерию Cэвиджa будет стратегия A2. Таким образом, в игре с матрицей (2.21.24) оптимальными по критериям Вальда и Севиджа будут разные стратегии, что и доказывает наше утверждение о неэквиволентности этих критериев. Muниминный кpumepuй (кpumepuu кpaйнего oоптимизма). Muниминный кpumepuй является противоположным критерию Севиджа и представляет собой частный случай обобщенного критерия Гурвица относительно рисков, когда коэффициенты Подставив коэффициенты (2.21.9) b формулу (2.21.40) и, yучитывая (2.21.39), получим показатель неэффективности стратегии Ai, no минимальному критерию :
Тогда, по формуле (2.21.41), onmuмальной cpeдu чистых cmpameгuй no миниминному критерию является стратегия С одной стороны, в соответствии с (2.19.6),
C другой стороны, среди рисков матрицы (2.21.36) имеются нулевые, поскольку для каждого элемента aij матрицы выигрышей (2.20.1), paвного Неравенства (2.21.48) h (2.21.49) oозначают, что минимин
Следовательно, по формуле (2.21.47), onmuмальнльной cpeдu чистых cmpameгuй no миниминному критерию является стратегия Из(2.21.9) и (2.21.6) получаем, что для миниминного критерия показатели пессимизма и оптимизма равны соответственно Соотношение между максимаксным и миниминным критериями крайнего оптимизма раскрывается в следующем утверждении: Теорема '2.21.2. Стратегия, оптимальная среди чистых стратегий по максимаксному критерию, является оптимальной о по миниминному критерию. Обратное не верно, т.е. существуют стратегии, оптимальные среди чистых стратегий по миниминному критерию, но не являющиеся оптимальными по максимаксному критерию.
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ![]() ©2015-2024 megaobuchalka.com Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1350)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |