Принятие решений в условиях неопределенности и риска
Лекция 2. Виды стратегий и игровых равновесий. Пусть имеется сообщество N, членов которого мы будем обозначать с помощью индекса Определение 1. Игрой n лиц в нормальной форме называется совокупность
Содержащая для каждого игрока – множество стратегий – функцию выигрыша (функцию полезности, целевую функцию, критерий оптимальности) Каждый игрок Предположим, что игроки в игре (1) действуют изолированно, т.е. каждый игрок выбирает свою стратегию независимо от того, какие стратегии выбирают другие участники. Игроки не обмениваются информацией. На выбор игроков не оказывает влияния прошлое. Будем пока считать, что каждому игроку известна только его собственная функция выигрыша; функций выигрыша остальных игроков он может не знать. Определение 2. Стратегия
где Обозначим через
Стратегия i-го игрока Подчеркнем, что для вычисления Определение 3. Стратегия
Обозначим через Определение 4. Исход Лемма 1. Пусть для любого Применим эту лемму без доказательства. Не будем давать также определения компактности и непрерывности, отметив лишь, что сделанные предположения являются достаточно слабыми и выполняются в большом числе реальных ситуаций. Таким образом, можно считать, что условия леммы 1 практически почти всегда выполняются. В противоположность этому, доминирующие стратегии могут не существовать даже в весьма простых играх. В самом деле, доминирующая стратегия должна одновременно быть решением зада максимизации
При всех значениях параметра Определение 5. Стратегии i-го игрока
Лемма 2. Пусть в игре (1) множество недоминируемых стратегий i-го игрока не пусто: Тогда следующие утверждения эквивалентны: – существует доминирующая стратегия i-го игрока: – все стратегии в множестве
…..если у игрока есть хотя бы одна доминирующая стратегия, то все доминирующие стратегии эквивалентны и совпадают с его недоминируемыми стратегиями. В этом случае будем считать, что если игрок использует одну из них (при некооперативном поведении, то есть действуя изолированно от других игроков). С другой стороны, если у i-го игрока нет доминирующей стратегии (наиболее частый случай), то его недоминируемые стратегии неэквивалентны, поэтому его некооперативное поведение не может быть определенно однозначно. Требуется дополнительные предположения об информации, которой располагают игроки (в частности, о функциях выигрыша). Равновесие в доминирующих стратегиях постулируется рациональным некооперативным поведением изолированных игроков.
Пример 1: «дилемма заключенного». Каждый из двух игроков располагает двумя стратегиями А и Р, где А обозначает агрессивность, Р – миролюбие. Предположим, что «мир» (оба игрока миролюбивы) лучше для обоих игроков, чем «война» (оба игрока агрессивны), но односторонняя агрессия (один игрок агрессивный, а другой миролюбивый) выгоднее агрессорам. Типичная структура выигрышей имеет следующий вид:
Стратегиями первого игрока являются строки платежной матрицы: Очевидно, для обоих игроков стратегия А доминирует стратегию Р. Таким образом, единственное равновесие в доминирующих стратегиях имеет вид Таким образом, некооперативное эгоистическое рациональное поведение вступает в противоречие с коллективными интересами, которые в данном случае диктует выбор мирных стратегий. В то же время, если игроки не обмениваются информацией, то война является наиболее вероятным исходом; изолированность стратегических выборов может нанести определенный ущерб общественным интересам. Определение Исход
Исход х называется оптимальным по Парето, если он не доминирует по Парето. Пример 2: «услуга за услугу». Если у одного участника есть несколько доминирующих стратегий, то для него они эквивалентны, но, возможно, неэквивалентны для остальных. Рассмотрим следующую игру двух лиц, в которой стратегии каждого участника влияют только на выигрыш другого, но не на свой собственный:
Любой исход является равновесием в доминирующих стратегиях (проверьте!), но только один из них (благожелательность к игроку 2, благожелательность к игроку 1) оптимален по Парето. Если у Один из способов исключения стратегий на множестве состоит в удалении доминируемых стратегий. Другой путь соответствует пессимистическому предположению (исключающему риск), что случиться худшее. Определение 7. В игре (9.1) стратегия
Обозначим через Лемма 3. Пусть множества
Используя осторожную стратегию, игрок Определение 8. Игра в нормальной форме (1) несущественна, если нет исхода
В несущественной игре осторожные стратегии оптимальны в следующем смысле. Теорема 1. Пусть игра 1. 2. 3. для любого подмножества
Доказательство. Поскольку
Поскольку игра несущественна, то Утверждение 2 следует из 3 при
Применяя утверждение 1 к
Объединяя обе системы неравенств для всех Согласно утверждению 1, если игрок Свойство 3 означает, что никакой отдельный игрок и никакая коалиция (подмножество) игроков не имеют причин для одностороннего отхода от оптимальных стратегий. Заметим, что в игре, которая не является несущественной, никакой набор стратегий
Иначе говоря, игрок Определение 9: Стратегия Это определение означает, что, если у игрока, независимо от действий противников, есть стратегия, дающая ему максимальный по сравнению с другими его стратегиями выигрыш, то эта стратегия называется доминантной. Целесообразность использования каждым игроком своих доминантных стратегий очевидна. Определение 10: Если для каждого игрока i существует доминантная стратегия Равновесие в доминантных стратегиях существует далеко не для всех игр. Приведем несколько лемм, определяющих некоторые классы игр, в которых существует равновесие в доминантных стратегиях.
Идею леммы 2 можно обобщить на значительно более широкий класс игр. Лемма 3. Если в игре п лиц
Для доказательства лемм 2 и 3 достаточно проверить определение РДС. Равновесие Нэша. Гораздо чаще, чем РДС, существует равновесие Нэша (РН). Джон Нэш, американский математик, в начале 50-х годов XX века предложил следующее: устойчивым исходом взаимодействия агентов можно считать такой вектор их действий, от которого в одиночку никому из них не выгодно отклоняться. Это значит, что ни один из агентов, в одиночку меняя свою стратегию на другую, не может увеличить свой выигрыш при условии, что остальные своих стратегий не меняют. Формальное определение равновесия Нэша (5) то есть для любого агента и для любого допустимого его действия выбор им равновесного по Нэшу действия дает ему выигрыш не меньший, чем при выборе любого другого действия при условии, что остальные игроки играют равновесные по Нэшу стратегии. Отличие между изложенными подходами (РДС и равновесием Нэша) заключается в том, что в формулировке равновесия в доминантных стратегиях (3) фигурирует произвольная обстановка, то есть доминантная стратегия – наилучшая при любой обстановке. А стратегия по Нэшу – наилучшая при «нэшевской» обстановке (см. (5)). Равновесие Нэша хорошо тем, что в большинстве моделей оно существует. Одним из его недостатков является то, что оно не всегда единственно. Ведь если есть два равновесия, то как предсказать, в каком из них окажутся агенты. Нужны дополнительные предположения. Кроме того, равновесие по Нэшу не устойчиво к отклонению двух и более игроков. По определению одному агенту не выгодно отклоняться, но это не значит, что если два агента договорились и одновременно отклонились от равновесной ситуации, то они не смогут оба выиграть. То есть равновесие Нэша – существенно некооперативная концепция равновесия.
Принятие решений в условиях неопределенности и риска. (Игры с природой. Теория статистических решений.)
Рассмотрим ситуацию принятия решений в условиях неопределенности внешней среды (состояние экономики, политики, природы). (Далее внешнюю среду будем называть природой.) Нет оснований считать, что природа расположена или нерасположена к нам, она нейтральна. Поэтому в этих случаях пользоваться результатами теории антагонистических игр было бы неразумно (крайне пессимистично). В то же время многое из теории игр оказывается полезным при анализе принципов оптимальности и в этом случае. Итак, ситуацию принятия решений в условиях неопределенности внешней среды назовем «игрой с природой». Игрок А – человек (лицо, принимающее решения - ЛПР), игрок П – природа. Решение ЛПР – стратегия. Поведение природы описывается одним из ее состояний. Возможны следующие принципы оптимальности 1) Доминирующие стратегии 2) Удаление доминируемых стратегий. 3) Осторожные стратегии (МГР). 4) Принцип благоприятствования стратегий.
Рассмотрим конечную игру с природой. Пусть задана A - матрица выигрыша. H (Ai, Пj) = aij
Определение. Показателем благоприятствования состояния природы (игрока) Пj к выигрышу игрока А называется βj = max aij .Риском i-той стратегии игрока А в состоянии Пj называется Величина rij = βj - aij. Таким образом, по матрице выигрышей можно построить матрицу рисков: А→Ra=║rij║, например:
Как привести неопределенность задачи принятия решений к определенности? 1) Задать вероятности состояний природы. 2) Задать относительные вероятности состояний природы. 3) Получить экспертнуюя информацию о вероятностях. 4) В условиях неизвестных вероятностей состояния природы (неопределенность) субъективным путем устранить неопределенность.
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ![]() ©2015-2024 megaobuchalka.com Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (911)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |