Решение матричных игр в смешанных стратегиях - Элементы теории игр в задачах оптимального управления экономическими процессами
Рассмотрим конечные матричные игры, в которых нет седловой точки, т. е. .
Нетрудно доказать, что. Если игра одноходовая, то по принципу минимакса игроку А гарантирован выйгрыш, а игроку В - проигрыш. Таким образом, для цены игры справедливо соотношение
(48)
Если игра повторяется неоднократно, то постоянный выбор игроками минимаксных стратегий не логичен. Действительно, игрок В, зная что игрок А применяет лишь минимаксную стратегию, выберет иную стратегию - стратегию, соответствующую наименьшему элементу в строке платежной матрицы. Такие же рассуждения имеют место и для поведения игрока А. Следовательно, при неоднократном повторении игры игрокам необходимо менять стратегии. Выясним механизм выбора игроками оптимальных стратегий, а также что принять за стоимость игры.
Рассмотрим матричную игру, заданную таблицей 6.
Таблица 6
Через и обозначим соответственно вероятности (относительные частоты), согласно которым игроки А и В выбирают стратегии и.
Очевидно, что
, , , .
Упорядоченные множества и полностью определяет характер игры игроков А и В и называются их смешанными стратегиями. Отметим, что любая их чистая стратегия и может быть описана как смешанная. Действительно, или.
Пусть игроки А и В применяют смешанные стратегии P и Q, выбирают их случайно. Тогда вероятность выбора комбинации будет равна.
Игра приобрела случайный характер. Следовательно, случайной становится и величина выигрыша.
Этой величиной является математическое ожидание выигрыша, которое определяется формулой:
Функцию называют платежной функцией игры с заданной матрицей. Как и выше, введем понятие нижней и верхней цены игры, сохраняя при этом обозначения и :
, .
Оптимальными смешанными стратегиями и называют такие стратегии, при которых. Величину называют Ценой игры V.
Для практических целей важны следующие свойства оптимальных смешанных стратегий, выражаемые следующими теоремами.
Сформулируем основную теорему теории игр.
Теорема (Нейман): Любая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
Теорема 1. Для того чтобы смешанные стратегии и были оптимальными, необходимо и достаточно выполнение неравенств
(49)
(50)
Теорема 2. Пусть
и -
Оптимальные смешанные стратегии и - цена игры.
Только те вероятности, отличны от нуля, для которых
.
Только те вероятности
,
Отличны от нуля, для которых
.
Методы решения матричных игр в смешанных стратегиях.
В этой лекции рассматриваются матричные игры, не имеющие седловых точек.
- игры.
Рассмотрим игру с платежной матрицей
Пусть игрок A применяет набор своих оптимальных стратегий. По основной теореме теории игр это обеспечивает ему выигрыш при любых стратегиях игрока В, т. е. выполняются соотношения:
(51)
Дополняя их уравнением
(52)
Получим систему линейных уравнений относительно и. Решая ее найдем
, , , (53)
Где.
Повторяя те же рассуждения для игрока В, получим систему линейных уравнений
(54)
Ее решениями будут
, , , (55)
Пример. Молокозавод поставляет в магазин молочную продукцию () и кисломолочную продукцию (). Согласно договора между ними продукция поступает в магазин два раза в день: с 10.00 до 11.00 (1-ый срок) и с 17.00 до 18.00 (2-ой срок). Если молокозавод соблюдает сроки поставок, то магазин выплачивает премии по следующей схеме: при поставке продукции в первый срок выплачивает 5 тыс. руб., во второй срок - 3 тыс. руб.; при поставке продукции в первый срок выплачивает 2 тыс. руб., во второй срок - 3 тыс. руб. Определить оптимальные стратегии поставок и получения продукции.
Решение. Примем молокозавод за игрока А, а магазин - за игрока В. Составим платежную матрицу игры:
Сроки Продукция |
1-ый срок |
2-ой срок |
5 |
1 | |
2 |
3 |
Или
Найдем
,
, седловой точки нет. Применим формулы (53) - (55) для определения оптимальных стратегий и цены игры:
, , , ,
, ,
Оптимальные стратегии:
, ,
Цена игры.
Таким образом, молокозавод поставляет молочную продукцию с вероятностью, а кисломолочную продукцию - с вероятностью, а магазин получает продукцию в 1-ый срок с вероятностью, а во 2-ой срок - с вероятностью и выплачивает 2,6 тыс. руб. премии молокозаводу ежедневно.
Матричная игра допускает простую геометрическую интерпретацию.
Нахождение цены игры и оптимальной стратегии для игрока А равносильно решению уравнения:
(56)
Для нахождения правой части (56) применим графический метод.
Пусть игрок А выбрал смешанную стратегию
, ,
А игрок В - k-ую чистую стратегию, . Тогда средний выигрыш игрока А окажется равным
при стратегии (57)
при стратегии (58)
Очевидно,
,
Которую называют нижней огибающей прямых I и II.
Нетрудно видеть, что
Таким образом, верхняя точка нижней огибающей - определяет оптимальную стратегию игрока А:
и цену игры.
Проиллюстрируем описанный графичексий метод на рассмотренной выше игре с платежной матрицей
.
На плоскости POz построим две прямые, описываемые уравнениями: и или (I) и (II).
Решая систему уравнений
Найдем, , .
Таким образом, имеем полученный выше ответ игры:
и.
Теперь покажем, как графическим методом найти стратегии игрока В.
(59)
Пусть игрок В выбрал смешанную стратегию
, ,
А игрок А - I-ую чистую стратегию, . Тогда средний выигрыш игрока В окажется равным
при стратегии (60)
при стратегии (61)
На плоскости qOz уравнения (60) и (61) описывают прямые III и IV
Очевидно,
,
Которую называют верхней огибающей прямых III и IV.
Нетрудно видеть, что
Таким образом, нижняя точка верхней огибающей - определяет оптимальную стратегию игрока В:
И цену игры.
Для рассмотренной выше гры с матрицей H найдем стратегии игрока В.
На плоскости QOz построим две прямые, описываемые уравнениями:
и или (III) и (IV).
Решая систему уравнений
Найдем
, , .
Таким образом, имеем
и.
Замечания. На практике оптимальную стратегию игрока В, если оптимальная стратегия игрока А, следовательно, и цена игры известны, находят приравниванием любого из двух средних выйгрышей игрока В к цене игры:
или.
Для рассмотренного примера такими уравнениями будут
или
Аналогично находят оптимальную стратегию игрока А, если известна оптимальная стратегия игрока В.
и - игры.
Решают такие игры графическим способом, описанным выше. Отличие от - игр заключается в следующем.
1) Нижняя (верхняя) огибающая семейства прямых
Содержит большее число отрезков.
2) Пусть в игре в верхней точке нижней огибающей пересекаются прямые и. Тогда при нахождении оптимальной смешанной стратегии игрока В согласно Теореме 2 полагают, что, , , , где Q - решение уравнения
или
3) Пусть в игре в нижней точке верхней огибающей пересекаются прямые и. Тогда при нахождении оптимальной смешанной стратегии игрока А согласно Теореме 2 полагают, что, , , , где P - решение уравнения
или.
- игры.
При решении таких игр рекомендуется предварительно уменьшить размеры платежной матрицы или упростить ее в некотором смысле. С этой целью применяют следующие правила.
Правило доминирования.
Из платежной матрицы исключают чистые стратегии заведомо невыгодные по сравнению с другими:
- А) для игрока А такими стратегиями являются те, которым соответствуют строки с элементами не большими по сравнению с элементами других строк; Б) для игрока В такими стратегиями являются те, которым соответствуют столбцы с элементами не меньшими по сравнению с элементами других столбцов.
Например, рассмотрим игру с матрицей
Сравнивая строки, убеждаемся, что элементы 2-ой строки не больше соответствующих элементов 1-ой строки, а 3-ья строка совпадает с 4-ой. Следовательно, стратегии и невыгодные и могут быть отброшены. Матрица игры преобразуется к матрице
Сравнивая столбцы полученной матрицы, убеждаемся, что элементы 2-го столбца не меньше соответствующих элементов 1-го столбца, а элементы 3-го столбца не меньше соответствующих элементов 4-го столбца, т. е. стратегии и также могут быть отброшены. Окончательно усеченная матрица игры имеет вид
.
Таким образом, оптимальными стратегиями игроков А и В игры с матрицей Н будут
и, где и -
Оптимальные стратегии игры с матрицей.
Аффинное правило.
Пусть и - оптимальные смешанные стратегии игроков А и В в игре с платежной матрицей
И ценой. Тогда и будут оптимальными стратегиями и в игре с матрицей
И ценой
.
Например, игру с матрицей
Можно заменить игрой с матрицей
,
Т. к. элементы этих матриц связаны соотношениями
:
; ; ; ; ; . При этом оптимальные стратегии игр совпадают, а цены игр связаны соотношением
.
В общем случае решение игр размера в смешанных стратегиях сводят к решению двух возможно двойственных ЗЛП..
Методы решения матричных игр в смешанных стратегиях.
Здесь рассматриваются матричные игры, не имеющие седловых точек.
- игры.
Рассмотрим игру с платежной матрицей
Пусть игрок A применяет набор своих оптимальных стратегий
.
По основной теореме теории игр это обеспечивает ему выигрыш при любых стратегиях игрока В, т. е. выполняются соотношения:
(62)
Дополняя их уравнением
(63)
Получим систему линейных уравнений относительно и. Решая ее найдем
, , , (64)
Где.
Повторяя те же рассуждения для игрока В, получим систему линейных уравнений
(65)
Ее решениями будут
, , , (66)
Пример. Молокозавод поставляет в магазин молочную продукцию () и кисломолочную продукцию (). Согласно договора между ними продукция поступает в магазин два раза в день: с 10.00 до 11.00 (1-ый срок) и с 17.00 до 18.00 (2-ой срок). Если молокозавод соблюдает сроки поставок, то магазин выплачивает премии по следующей схеме: при поставке продукции в первый срок выплачивает 5 тыс. руб., во второй срок - 3 тыс. руб.; при поставке продукции в первый срок выплачивает 2 тыс. руб., во второй срок - 3 тыс. руб. Определить оптимальные стратегии поставок и получения продукции.
Решение. Примем молокозавод за игрока А, а магазин - за игрока В. Составим платежную матрицу игры:
Сроки Продукция |
1-ый срок |
2-ой срок |
5 |
1 | |
2 |
3 |
Или
Найдем
,
, седловой точки нет. Применим формулы (63) - (65) для определения оптимальных стратегий и цены игры:
, , , ,
, ,
Оптимальные стратегии:
, ,
Цена игры.
Таким образом, молокозавод поставляет молочную продукцию с вероятностью, а кисломолочную продукцию - с вероятностью, а магазин получает продукцию в 1-ый срок с вероятностью, а во 2-ой срок - с вероятностью и выплачивает 2,6 тыс. руб. премии молокозаводу ежедневно.
Матричная игра допускает простую геометрическую интерпретацию.
Нахождение цены игры и оптимальной стратегии для игрока А равносильно решению уравнения:
(66)
Для нахождения правой части (66) применим графический метод.
Пусть игрок А выбрал смешанную стратегию, , а игрок В - K-ую чистую стратегию, . Тогда средний выигрыш игрока А окажется равным
при стратегии (67)
при стратегии (68)
Очевидно,
,
Которую называют нижней огибающей прямых I и II.
Нетрудно видеть, что
Таким образом, верхняя точка нижней огибающей - определяет оптимальную стратегию игрока А:
и цену игры.
Проиллюстрируем описанный графичексий метод на рассмотренной выше игре с платежной матрицей
.
На плоскости POz построим две прямые, описываемые уравнениями:
и или (I) и (II).
Решая систему уравнений
Найдем
, , .
Таким образом, имеем полученный выше ответ игры:
и.
Теперь покажем, как графическим методом найти стратегии игрока В.
(69)
Пусть игрок В выбрал смешанную стратегию
, ,
А игрок А - I-ую чистую стратегию, . Тогда средний выигрыш игрока В окажется равным
при стратегии (70)
при стратегии (71)
Очевидно,
,
Которую называют верхней огибающей прямых III и IV.
Нетрудно видеть, что
Таким образом, нижняя точка верхней огибающей - определяет оптимальную стратегию игрока В:
и цену игры.
Для рассмотренной выше гры с матрицей H найдем стратегии игрока В.
На плоскости QOz построим две прямые, описываемые уравнениями:
и или (III) и (IV).
Решая систему уравнений
Найдем
, , .
Таким образом, имеем
и.
Замечания. На практике оптимальную стратегию игрока В, если оптимальная стратегия игрока А, следовательно, и цена игры известны, находят приравниванием любого из двух средних выигрышей игрока В к цене игры:
или.
Для рассмотренного примера такими уравнениями будут
или
Аналогично находят оптимальную стратегию игрока А, если известна оптимальная стратегия игрока В.
и - игры.
Решают такие игры графическим способом, описанным выше. Отличие от - игр заключается в следующем.
4) Нижняя (верхняя) огибающая семейства прямых
Содержит большее число отрезков.
5) Пусть в игре в верхней точке нижней огибающей пересекаются прямые и. Тогда при нахождении оптимальной смешанной стратегии игрока В полагают, что, , , , где Q - решение уравнения
или
6) Пусть в игре в нижней точке верхней огибающей пересекаются прямые и. Тогда при нахождении оптимальной смешанной стратегии игрока А полагают, что, , , , где P - решение уравнения
или.
- игры.
При решении таких игр рекомендуется предварительно уменьшить размеры платежной матрицы или упростить ее в некотором смысле. С этой целью применяют следующие правила.
Правило доминировнаия.
Из платежной матрицы исключают чистые стратегии заведомо невыгодные по сравнению с другими:
- А) для игрока А такими стратегиями являются те, которым соответствуют строки с элементами не большими по сравнению с элементами других строк; Б) для игрока В такими стратегиями являются те, которым соответствуют столбцы с элементами не меньшими по сравнению с элементами других столбцов.
Например, рассмотрим игру с матрицей
Сравнивая строки, убеждаемся, что элементы 2-ой строки не больше соответствующих элементов 1-ой строки, а 3-ья строка совпадает с 4-ой. Следовательно, стратегии и невыгодные и могут быть отброшены. Матрица игры преобразуется к матрице
Сравнивая столбцы полученной матрицы, убеждаемся, что элементы 2-го столбца не меньше соответствующих элементов 1-го столбца, а элементы 3-го столбца не меньше соответствующих элементов 4-го столбца, т. е. стратегии и также могут быть отброшены. Окончательно усеченная матрица игры имеет вид
.
Таким образом, оптимальными стратегиями игроков А и В игры с матрицей Н будут и, где и - оптимальные стратегии игры с матрицей.
Аффинное правило.
Пусть и - оптимальные смешанные стратегии игроков А и В в игре с платежной матрицей и ценой. Тогда и будут оптимальными стратегиями и в игре с матрицей
и ценой.
Например, игру с матрицей
Можно заменить игрой с матрицей
,
Т. к. элементы этих матриц связаны соотношениями
:
; ; ; ; ; . При этом оптимальные стратегии игр совпадают, а цены игр связаны соотношением
.
В общем случае решение игр размера в смешанных стратегиях сводят к решению двух возможно двойственных ЗЛП.
Редукция матричных игр к ЗЛП.
Пусть игра задана платежной матрицей. Через и обозначим соответственно оптимальные стратегии игроков А и В. Пусть - цена игры. Не умаляя общности, полагаем. В противном случае с помощью аффинного правила добьемся того, что все.
Оптимальная стратегия стратегия игрока А обеспечивает ему средний выигрыш, не меньший, при любой стратегии игрока В. Поэтому все средние выигрыши игрока А можно выписать в виде системы неравенств:
(72)
Введем новые переменные:
(73)
Тогда после деления каждого неравенства из (71) на получим новую систему неравенств
(73)
Из равенства
Нетрудно получить соотношение для :
.
Игрок А Стремится максимизировать свой гарантированный выигрыш. Максимизация равносильна минимизации. Следовательно, получили следующую задачу для нахождения оптимальной стратегии игрока А:
(74)
При условиях (73) и
(75)
Сформулированная задача (74) - (76) является ЗЛП.
Повторим с естественными изменениями предыдущие рассуждения для определения оптимальной стратегии игрока В.
Игрок В стремиться минимизировать гарантированный проигрыш. Все средние проигрыши игрока В запишем в виде системы неравенств:
, (76)
Которые следуют из того, что средний проигрыш игрока В не превосходит цены игры при любой стратегии игрока А.
В обозначениях
Система неравенств (76) примет вид
(77)
Применение удовлетворяют соотношению
.
Минимизация равносильна максимизации.
Получили следующую задачу для нахождения оптимальной стратегии игрока В:
(78)
При условиях (77) и
(79)
Задача (77) - (79) также является ЗЛП.
Таким образом, игра свелась к двум ЗЛП, которые запишем в матричном виде
, , ,
Очевидно, задачи I и II являются двойственными ЗЛП.
Похожие статьи
-
Пусть у игроков А и В соответственно M и N чистых стратегий, которые обозначим через и. Выбор игроками любой пары стратегий и однозначно определяет исход...
-
Объем выпуска продукции Y зависит от количества вложенного труда x как функция . Цена продукции v, зарплата p. Другие издержки не учитываются. Найти...
-
В условиях рыночной экономики возникают ситуации, в которых сталкиваются интересы двух и более сторон. Такие ситуации относятся к конфликтным. Например,...
-
Комментарии к третьему разделу курсовой работы В третьем разделе курсовой работы студенту предлагается определить оптимальную стратегию заказа в условиях...
-
При решении экономических задач часто анализировать ситуации, в которых сталкиваются интересы двух или более конкурирующих сторон, преследующих различные...
-
Модели теории игр. Основные определения и термины В разных областях целенаправленной деятельности, например при разработке и эксплуатации АСУ, часто...
-
Теория игр исследует оптимальные стратегии в ситуациях игрового характера. К ним относятся ситуации, связанные с выбором наивыгоднейших производственных...
-
В разделе 1 курсовой работы требуется: Определить количество закупаемого заданным филиалом фирмы сырья у каждого АО, (xj), максимизируя прибыль филиала....
-
Исходная задача: При ограничениях: Двойственной является следующая задача: При ограничениях: Число неизвестных в двойственной задаче равно 2....
-
Ограничение чувствительность задача программирование Вариации правых частей ограничений приводят к изменению области допустимых решений ЗЛП, в действии...
-
Вариации коэффициентов целевой функции ЗЛП приводят к изменению направления вектора градиента. Так как при этом не затрагивается допустимое множество, то...
-
Второй раздел курсовой работы посвящен особенностям постановки и решения общей задачи линейного программирования, а именно, транспортной задаче (ТЗЛП)....
-
Основные понятия теории экономико-математического моделирования Кибернетический подход к исследованию экономико-математических систем Обычно...
-
Решение: Строим на плоскости х1Ох2 многоугольник решений. Для этого в неравенствах системы ограничений и условиях неотрицательности переменных знаки...
-
Завод по изготовлению телевизоров, находясь в состоянии 1, может увеличить спрос путем организации рекламы. Это требует добавочных затрат и уменьшает...
-
Для достижения поставленной цели предприятию требуются материалы, оборудование, энергия, рабочая сила и другие ресурсы. Каждое предприятие такими...
-
Модель в общем смысле (обобщенная модель) есть создаваемый с целью получения и (или) хранения информации специфический объект (в форме мысленного образа,...
-
Элементы матричного анализа - Методы решения системы линейных уравнений
Вектором, как на плоскости, так и в пространстве, называется направленный Отрезок , то есть такой Отрезок , один из концов которого выделен и называется...
-
Программное управление Относительно просто может быть сформулирована так называемая задача программного управления. В ней предполагается, что управляющие...
-
Управление научной деятельностью представляет собой сложный процесс. В литературе подобного типа задачи рассматриваются путем построения иерархий, дерева...
-
Решение задачи оптимального управления - Стохастическая полумарковская модель
Воспользуемся теоремой о структуре стационарного показателя качества управления, сформулированной в предыдущем разделе. Отметим, что рассматриваемая в...
-
Вероятностные характеристики полумарковской модели Формулы для условных вероятностей Обозначим Теорема 1. В рассматриваемой стохастической полумарковской...
-
Тема, с которой мы сегодня ознакомимся это "Применение матриц при решении экономических задач." Рассмотрим как с помощью матриц можно решать...
-
Динамическое программирование Динамическое программирование -- один из разделов оптимального программирования, в котором процесс принятия решения и...
-
Итак, в первых двух разделах курсовой работы мы использовали модуль Excel "Поиск решении" для решения задачи общего линейного программирования (1 раздел)...
-
Задание. Рассматривается вычислительная система состоящая из n вычислительных машин. Имеется n задач. Задана матрица T определяющая время решения i-й...
-
Изучение теоретических вопросов анализа чувствительности оптимального решения ЗЛП к вариациям некоторых параметров задачи и введению нового ограничения....
-
Необходимость введения нового ограничения может возникнуть, например, когда первоначально для сокращения затрат машинного времени некоторые интуитивно...
-
Решение смешанной задачи для уравнения теплопроводности методом конечных разностей
Решение смешанной задачи для уравнения теплопроводности методом конечных разностей 1. Цель работы Ознакомление с методами решения смешанных задач для...
-
A 25 40 50 30 45 20 7 3 4 8 6 60 5 7 2 3 5 45 1 4 10 2 6 70 3 4 2 7 8 Допустим, стоимость доставки единицы груза из каждого пункта отправления в...
-
Как известно решение задач симплексным методом применяется очень часто. Это связано с тем, что симплексный метод подходит для решения широкого круга...
-
Известно оптимальное решение X*=(0;0;1;1) задачи линейного программирования: Составьте двойственную задачу и найдите ее оптимальное решение по теореме...
-
Математическая модель транспортной задачи: F = ??cIjXIj, (1) При условиях: ?xIj = aI, i = 1,2,..., m, (2) ?xIj = bJ, j = 1,2,..., n, (3)...
-
Ценностная окраска ситуационных образов, возникающих в сознании членов человеческого сообщества, является основным движущим стимулом, формирующим их...
-
Несмотря на требование линейности функций критериев и ограничений, в рамки линейного программирования попадают многочисленные задачи распределения...
-
Календарный производственный программирование однооперационный Все существующие методы решения задач календарного планирования3 по степени достижения...
-
Алгоритм использует в качестве исходных данных документы, содержащие следующие сведения: X A, k,j, i - измеряемые показатели научной работы; X A, TG,...
-
Описание процесса решения - Формирование оптимального штата фирмы
На рабочем листе Excel в диапазоне ячеек от А1 до D4 в зависимости от выбранного количества предприятий размещаются исходные данные. Они будут...
-
Условие задачи. Пусть имеются n кандидатов для выполнения этих работ. Назначение кандидата i на работу j связано с затратами CIj (i, j = 1,2,..., n)....
-
Экономические задачи, сводящиеся к транспортной модели Транспортная модель используется для составления наиболее экономичного плана перевозок одного вида...
Решение матричных игр в смешанных стратегиях - Элементы теории игр в задачах оптимального управления экономическими процессами