Моделирование
в условиях противодействия, игровые моделиСтраница 4
придется на специальных языках программирования (например — язык Prolog
). Эти языки велико-лепны для решения логических задач, но практически непригодны для обычных вычислений.
Если же использовать метод минимакса, то весь алгоритм поиска седловой точки займет на языке Pascal
или C++
не более 5 .10 строк программы.
Рассмотрим еще один простой пример игры, но уже без седловой точки
.
C1 |
C2 | |
S1 |
-3000 |
+7000 |
S2 |
+6000 |
+1000 |
Таблица 3.8
Задача в этом случае для нас (и для нашего разумного конкурента) будет заключаться в смене стратегий, в надежде найти такую их комбинацию, при которой математическое ожидание выигрыша или средний выигрыш за некоторое число ходов будет максимальным.
Пусть мы приняли решение половину ходов в игре делать с использованием S1
, а другую половину — с S2
. Конечно, мы не можем знать, какую из своих двух стратегий будет применять конкурент, и поэтому придется рассматривать два крайних случая его поведения.
Если наш конкурент все время будет применять C1
, то для нас выигрыш составит 0.5·(-3000)+0.5·(+6000) = 1500
гривен.
Если же он все время будет применять C2
, то на выигрыш составит 0.5·(+7000)+0.5·(+1000) = 4000
гривен.
Ну, это уже повод для размышлений, для анализа. В конце концов, можно прикинуть, а что мы будем иметь в случае применения конкурентом также смешанной стратегии? Ответ уже готов — мы будем иметь выигрыш не менее 1500 гривен, поскольку выполненные выше расчеты охватили всеварианты смешанных стратегий конкурента.
Поставим вопрос в более общем виде — а существует ли наилучшая
смешанная стратегия (комбинация S1и S2
) для нас в условиях применения смешанных стратегий (комбинации C1
и C2
) со стороны конкурента? Математическая теория игр позволяет ответить на этот вопрос утвердительно — оптимальная смешанная стратегия всегда существует, но она может гарантировать минимумматематического ожидания выигрыша
. Методы поиска таких стратегий хорошо разработаны и отражены в литературе.
Таким образом, мы снова оказались в роли ЛПР — системный подход не может
дать рецепта для безусловногополучения выигрыша.
Нам и только нам, решать — воспользоваться ли рекомендацией и применить оптимальную стратегию игры, но при этом считаться с риском возможного проигрыша (выигрыш окажется гарантированным лишь при очень большом числе ходов).
Завершим рассмотрение последнего примера демонстрацией поиска наилучшей смешанной стратегии.
Пусть мы применяем стратегию S1с частотой e
, а стратегию S2
с частотой (1 -
e
Другое по теме
Вместо предисловия
– Ну я пошел. – Мой друг Александр Саввич решительно взялся
за пальто.
– Посиди еще, – попросил я. – Ведь нет еще двенадцати. А я
расскажу тебе о плане своей новой книги.
– Ну ладно, – согласился гость без энтузиазма. Его сейч ...