![]() |
|
сделать стартовой | добавить в избранное |
![]() |
Теория игр |
Классификация игр Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д. В зависимости от количества игроков различают игры двух и игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков - тем больше проблем. По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий игра называется бесконечной. По характеру взаимодействия игры делятся на: бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) – могут вступать в коалиции. В кооперативных играх коалиции наперёд определены. По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой. По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др. Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям). Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования. Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.) Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные. Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения. Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко. Матричные игры Решение матричных игр в чистых стратегиях. Матричная игра двух игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков. Первый игрок имеет m стратегий i = 1,2,.,m, второй имеет стратегий j = 1,2,.,
. Каждой паре стратегий (i,j) поставлено в соответствие число аij, выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i-ю стратегию, а 2 – свою j-ю стратегию. Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=), 2 – свою j-ю стратегию (j=), после чего игрок 1 получает выигрыш аij за счёт игрока 2 (если аij&l ; 0, то это значит, что игрок 1 платит второму сумму аij ). На этом игра заканчивается. Каждая стратегия игрока i=; j = часто называется чистой стратегией. Если рассмотреть матрицу А = то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i-й строки, а игроком 2 j-го столбца и получения игроком 1 (за счёт игрока 2) выигрыша аij. Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i (i =) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2 аij (i = ) т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = iо, при которой этот минимальный выигрыш будет максимальным, т.е. находится аij = = (1). Определение. Число , определённое по формуле (1) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2. Игрок 2 при оптимальном своём поведении должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается аij т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j1 стратегию, при которой игрок 1 получит mi выигрыш, т.е. находит aij = = (2). Определение. Число , определяемое по формуле (2), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1. Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем . Определение. Если в игре с матрицей А =, то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры u = =. Седловая точка – это пара чистых стратегий (iо,jо) соответственно игроков 1 и 2, при которых достигается равенство = . В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке. Математически это можно записать и иначе: где i, j – любые чистые стратегии соответственно игроков 1 и 2; (iо,jо) – стратегии, образующие седловую точку.
Таким образом, исходя из (3), седловой элемент является минимальным в iо-й строке и максимальным в jо-м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце. Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку. Пара чистых стратегий (iо,jо) игроков 1 и 2, образующая седловую точку и седловой элемент , называется решением игры. При этом iо и jо называются оптимальными чистыми стратегиями соответственно игроков 1 и 2. Пример 1 Седловой точкой является пара (iо = 3; jо = 1), при которой u == = 2. Заметим, что хотя выигрыш в ситуации (3;3) также равен 2 ==, она не является седловой точкой, т.к. этот выигрыш не является максимальным среди выигрышей третьего столбца. Пример 2 Из анализа матрицы выигрышей видно, что , т.е. данная матрица не имеет седловой точки. Если игрок 1 выбирает свою чистую максиминную стратегию i = 2, то игрок 2, выбрав свою минимаксную j = 2, проиграет только 20. В этом случае игроку 1 выгодно выбрать стратегию i = 1, т.е. отклониться от своей чистой максиминной стратегии и выиграть 30. Тогда игроку 2 будет выгодно выбрать стратегию j = 1, т.е. отклониться от своей чистой минимаксной стратегии и проиграть 10. В свою очередь игрок 1 должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а игрок 2 ответит выбором 2-й стратегии и т.д. Смешанное расширение матричной игры. Исследование в матричных играх начинается с нахождения её седловой точки в чистых стратегиях. Если матричная игра имеет седловую точку в чистых стратегиях, то нахождением этой седловой точки заканчивается исследование игры. Если же в игре нет седловой точки в чистых стратегиях, то можно найти нижнюю и верхнюю чистые цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью. Определение. Смешанной стратегией игрока называется полный набор вероятностей применения его чистых стратегий. Таким образом, если игрок 1 имеет m чистых стратегий 1,2,.,m, то его смешанная стратегия x – это набор чисел x = (x1, ., xm) удовлетворяющих соотношениям xi ³ 0 (i = 1,m), = 1. Аналогично для игрока 2, который имеет чистых стратегий, смешанная стратегия y – это набор чисел y = (y1, ., y ), yj ³ 0, (j = 1, ), = 1. Так как каждый раз применение игроком одной чистой стратегии исключает применение другой, то чистые стратегии являются несовместными событиями. Кроме того, они являются единственными возможными событиями. Чистая стратегия есть частный случай смешанной стратегии. Действительно, если в смешанной стратегии какая-либо i-я чистая стратегия применяется с вероятностью 1, то все остальные чистые стратегии не применяются.
Я поневоле вспоминаю Хейзингу и свои разногласия с ним: теория Игры взывает к упрощению. Сегодня мы с неизбежностью должны расширить это определение, разрешая поэзии не быть прозой, вообще не быть чем угодно, лишь бы быть чем-то (например, самое простое, чтобы все слова начинались с одной буквы, складывались в занятный узор, четыре черненьких чумазеньких чертенка) только непременно оговоренным заранее, иными словами, обязать ее выполнять условия какого-нибудь внешнего формализма (активный формализм ''содержания''), одновременно удовлетворяя формализму внутреннему (пассивному формализму ''формы''), то есть быть своего рода алгеброй, правила которой стоило бы доработать. Стоит иметь в виду, что в числе пассивных формализмов есть немало невидимых, таковы, например, естественные ритмы и сечения, привитые формы-цитаты-цикады, сходства и подобия, геометрии физические и социальные. А поскольку само понятие поэзии здесь вовсе не использовано, я рискну понять Стагирита так: эстетический эффект, клик в душе человеческой возникает, когда (отдельный вопрос - случайно или осознанно в любом жанре) происходит нечто ''ясное и не низкое'', то есть достаточно хорошо отвечающее требованиям двух различных формализмов
1. Теория игр и принятие решений
2. Теория игр и принятие решений
3. Теория игр. Корпоративные игры
4. Теория игр
5. Модель олигополии в контексте теории игр
9. Лабораторная работа №5 по "Основам теории систем" (Транспортные задачи линейного программирования)
11. Лабораторная работа №6 по "Основам теории систем" (Решение задачи о ранце методом ветвей и границ)
12. Теория политики в работе Шапиро
13. Контрольная работа по основам экономической теории
14. Контрольная работа по теории вероятности_2
15. Теория и практика социальной работы
16. Курсовая работа по теории электрических цепей
17. О необходимости культурологической ориентированности теории и практики социальной работы
18. Контрольная работа по предмету «Теория бухгалтерского учета»
19. Лабораторная работа по дисциплине теория и проектирование ЭВМ
20. Развитие теории менеджмента в работе Э. Шейна
25. Социальная политика и социальная работа: место и роль социальной политики в теории социальной работе
26. Теория в социальной работе
28. Методы теории социальной работы
29. Деревянные конструкции (лабораторные работы)
30. Разработка основных разделов проекта производства работ
32. Реактивные двигатели, устройство, принцип работы
33. Оценка безотказной работы технической аппаратуры (задачи)
34. Принцип работы и назначение телескопа
37. Отчёт по лабараторным работам по биологии за 1 семестр
41. Пути и способы повышения устойчивости работы РЭА
42. Воспитательная работа в вооруженных силах и ее влияние на психику воина в боевой деятельности
43. Спасательные и неотложные аварийно-восстановительные работы
44. Организация и проведение спасательных работ в чрезвычайных ситуациях
45. Применение ЭВМ для повышения эффективности работы штаба ГО РАТАП
46. Спасательные и неотложные аварийно-восстановительные работы в очагах поражения
48. Бюджетный дефицит и государственный долг: теория проблемы и ее проявление в российской экономике
49. Совершенствование организации работы отдела контроля за поступлением налогов с физических лиц
50. Шпаргалки для госэкзамена по теории государства и права
51. Иск в гражданском процессе: теория и практика
52. Контрольная работа по всеобщей истории государства и права
53. Теория этногенеза Л.Н.Гумилева
57. Контрольная работа по Римскому праву
58. Лекции (часть) по теории государства и права
60. Договорная теория возникновения государства и права
61. Теория государства и права
62. Теория государства и права
63. Теория государства и права (Шпаргалка)
64. Теория Государства и Права как юридическая наука
66. Шпаргалка по теории государства и права
67. Теория государства и права. Правовой статус личности
68. Ответы к экзаменационным билетам по Теории государства и права
69. Происхождение права, теории происхождения права, понятие признаки, виды, функции, принципы
73. Порядок увольнения с работы и его оформление
74. Прием на постоянное место работы
75. Лабораторные работы по охране труда в Угольной промышленности
76. Контрольная работа по курсу экологического права
77. How "DNA" testing works Анализ "ДНК" как проверяющие работы)
78. Особенности работы с антонимамми в школе
79. Диапазон голоса и работа над ним
80. Сравнительный анализ портретов Ф.И Шаляпина. Работы Б.М Кустодиева и К.А Коровина
81. "О культуре" по работе Н.А. Бердяева "Философия неравенства" (Windows)
82. Культурология и теория цивилизаций
83. Антропогенез: эволюционная теория происхождения человека
84. Проблемы теории культуры в отечественной философии (А. Ф. Лосев, М. К. Мамардашвили)
85. Шпоры по Поэтике или теории литературы
89. Начальный этап работы над музыкальным произведением
90. Теория Якобинской диктатуры
91. Норманнская теория происхождения государства у славян и ее роль в российской истории
92. Работа с редактором Vi. Другие текстовые редакторы UNIX
93. Принципы работы системы управления параллельными процессами в локальных сетях компьютеров
94. Работа маршрутизаторов в компьютерной сети
95. Как играть в игры с помощью модэма
97. Краткий конспект лекций по Теории тестирования аппаратных и программных средств
98. Принцип программного управления. Микропроцессор. Алгоритм работы процессора