Теория игр и игровые модели военных действий

XVIII Международный конкурс научно-исследовательских и творческих работ учащихся
Старт в науке

Теория игр и игровые модели военных действий

Картушин И.В. 1
1ФГКОУ СК СВУ
Доева М.Р. 1
1ФГКОУ СК СВУ
Автор работы награжден дипломом победителя II степени
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение

Теорией игр называют математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за осуществление своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу — в зависимости от своего поведения и поведения других игроков. Теория игр помогает выбрать наиболее выгодные стратегии с учётом соображений о других участниках, их ресурсах и их предполагаемых действиях.

Эта теория представляет собой раздел математики, изучающий конфликтные ситуации, который анализирует конфликты, используя математические методы. Теория получила своё название, в связи с тем, что простейшим примером конфликта является игра (например, шахматы или крестики-нолики). Как в игре, так и в конфликте каждый игрок имеет свои цели и пытается их достигнуть, принимая разные стратегические решения.

В представленной исследовательской работе мы хотели бы изучить историю возникновения и развития теории игр, понять основные определения, а также выяснить можно ли с помощью теории игр предсказать исход ряда игр, рассчитать вероятность наступления выигрыша.

Большинство считают, что предугадать результат игр, в которых властвует случай, невозможно. Это не так. Математическое ожидание выигрыша - величина, которая поможет нам определить, справедлива ли та или иная игра, и выгодно ли нам в нее играть.

Актуальность выбранной темы предопределена широтой сфер ее применения. Теория игр играет центральную роль в теории отраслевой организации, теории конфликтов, теории корпоративных финансов и многих других областях. Область применения теории игр включает не только экономические дисциплины, но и биологию, политологию, военное дело и др.

Объектом исследования выступила теория игр.

Предмет исследования – сущность и применение теории игр в практике компьютерного моделирования военных действий.

Цель работы познакомиться с возможностями теории игр при математическом и компьютерном моделировании военных действий, продемонстрировать способы решения задач ЕГЭ по теории игр.

Задачи:

подобрать необходимую литературу и отобрать материал для исследования;

проанализировать и систематизировать полученную информацию;

ознакомиться с историей зарождения теории игр;

определить понятие и сущность теории игр;

дать характеристику основным типам игр;

выяснить, можно ли с помощью теории игр предсказать исход ряда игр;

изучить способы решения задач ЕГЭ.

В настоящее время значение теории игр значительно возросло во многих областях экономических и социальных наук. В экономике она применима не только для решения разных задач общехозяйственного значения, но и для анализа стратегических проблем предприятий, разработок структур управления и систем стимулирования.

В период с 1958 по 1966 гг. была создана советская школа в теории игр, для которой было характерно скопление усилий в области антагонистических игр и строго военных приложений.

Основная часть

1. История появления теории игр

Теория игр - это логико-математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более стороны, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу - в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.

Принято считать монографию Дж. Неймана и О. Моргенштерна “Теория игр и экономическое поведение”, моментом рождения теории игр. После её публикации в 1944 г., многие ученые предсказали революцию в экономических науках благодаря использованию нового подхода. Эта теория описывала рациональное поведение принятия решений во взаимосвязанных ситуациях, помогая решать многие актуальные проблемы в разных научных областях. Монография подчеркивала, что стратегическое поведение, конкуренция, кооперация, риск и неопределенность, являются главными элементами в теории игр и непосредственно связаны с задачами управления. [1]

Хотя теория игр первоначально и рассматривала экономические модели, вплоть до 1950-х она оставалась формальной теорией в рамках математики. Но уже с 1950-х гг. начинаются попытки применить методы теории игр не только в экономике, но и в биологии, кибернетике, технике, антропологии. Во время Второй мировой войны и сразу после нее теорией игр серьёзно заинтересовались военные, которые увидели в ней мощный аппарат для исследования стратегических решений.

Основными исследованиями теории игр в военном делее являются модели Ф. Ланчестера и разработки Т. Эдисона периода Первой мировой войны, затем – количественные (в основном вероятностные) методы оценки боевой эффективности различных видов вооружения, получившие активное развитие, начиная с 1939 г., и приведшие к формированию такого самостоятельного научного направления как исследование операций.

2. Определение теории игр

Теорией игр называют математический метод изучения оптимальных стратегий в играх. Она представляет собой раздел математики, изучающий конфликтные ситуации. Теория получила своё название, так как простейшим примером конфликта является игра (например, шахматы или крестики-нолики). Как в игре, так и в конфликте каждый игрок имеет свои цели и пытается их достигнуть, принимая разные стратегические решения. [1]

Игра — это любая ситуация, в которой выигрыш игрока зависит не только от его собственных действий, но и от поведения остальных участников. Игра подразумевает обязательное наличие столкновения интересов.Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу — в зависимости от своего поведения и поведения других игроков. Теория игр помогает выбрать наиболее выгодные стратегии с учётом соображений о других участниках, их ресурсах и их предполагаемых действиях. Стратегия — описание действий игрока во всех возможных ситуациях. Исход — комбинация выбранных стратегий. Ход - выбор игроком одного из предусмотренных правилами игры действий и его осуществление.Ходы бывают личные и случайные. При личном ходе игрок сознательно выбирает и осуществляет тот или другой вариант действий (пример — любой ход в шахматах). При случайном ходе выбор осуществляется неволей игрока, а каким-то механизмом случайного выбора (пример – бросание монеты). [7]

3. Теория игр в военном деле

Информация – один из наиболее значимых в настоящее время ресурсов. И сейчас все также справедливо высказывание «Кто владеет информацией, тот владеет миром». Более того, на первый план выходит необходимость эффективно использовать имеющуюся информацию. Теория игр в купе с теорией оптимального управления позволяют принимать правильные решения в разнообразных конфликтных и неконфликтных ситуациях.

Военное дело, как ярко выраженное существо конфликта, стало одним из первых полигонов применения на практике разработок теории игр. Изучение задач военных сражений с помощью теории игр – это большой и трудный предмет. Применение теории игр к задачам военного дела означает, что для всех участников могут быть найдены эффективные решения – оптимальные действия, позволяющие максимально решить поставленные задачи.

Военный анализ есть вещь гораздо более неопределенная в смысле законов, предсказаний и логики, нежели физические науки. В некоторых случаях дифференциальные игры в задачах военного дела играют очень важную роль. Это верно, например, для большинства моделей, включающих преследование, отступление и другое маневрирование подобного рода.

Довольно часто в конфликтных ситуациях противоборствующие стороны объединяются в союзы для достижения лучших результатов. Поэтому возникает необходимость моделирования коалиционных игр. [4]

4. Теоретико-игровые модели военных действий

Классическая теория игр используется в приложении к задачам организации, планирования и проведения военных операций, выбора оптимальных группировок вооруженных сил и систем вооружения. Сюда же следует отнести:

– задачу распределения ограниченных ресурсов обороны и нападения (обобщенное название – игра полковника Блотто, рассматриваемая более подробно ниже), в том числе – с разведкой (игра в развернутой форме сводится к матричной игре);

– игры типа дуэлей (выбор оптимальных моментов или оптимальных дистанций открытия огня);

– «политологические» модели анализа причин войн;

– модели гонки вооружений и международного сотрудничества в военной сфере.

Вторым обширным классом теоретико-игровых моделей, нашедших широкое применение в военном деле, являются дифференциальные игры и игры поиска, включая современные задачи управления движением в конфликтной среде.

Задачи поиска подвижного объекта, активно противодействующего обнаружению поисковой системой, получили название «поиск в условиях конфликта». Можно выделить две основные группы постановок задач, в зависимости от характера противодействия:

– поиск истинной цели в наблюдаемом составе группы целей, включающей ложные цели;

– поиск цели при подавленном канале наблюдений.

Задачи второй группы формулируются как дифференциальные игры в смешанных стратегиях с критерием «вероятность обнаружения». Конструктивных решений на сегодняшний день немного.

Одним из примеров приложений являются теоретико-игровые модели информационного противоборства в социальных сетях, где используется аппарат и иерархических, и рефлексивных игр. [5]

5. Игра полковника Блотто

Игрой полковника Блотто (ИПБ), впервые рассмотренной в 1921 году, называется игра двух лиц, в которой игроки однократно, одновременно и независимо (не зная выбора оппонента) распределяют свои ограниченные ресурсы между конечным числом объектов (полей сражений или объектов защиты/нападения, одновременных конкурсов/аукционов, групп избирателей и т.п.).

Обозначим через N = {1, …, n} множество объектов, через x = (x1, …, xn) – действие первого игрока, через y = (y1, …, yn) – действие второго игрока, где xi ≥ 0 (yi ≥ 0) – количество ресурса, выделенного первым (вторым) игроком на i-й объект, i = 1…n .

Ограниченность ресурсов отражена условиями

 

(1)

В вероятностной модели ИПБ вероятность px (xi, yi) победы первого игрока на i-м объекте не зависит от других объектов и «пропорциональна» количеству выделенного им на этот объект ресурса и «обратно пропорциональна» взвешенной сумме ресурсов, выделенных на этот объект обоими игроками:

 

(2)

где

Содержательно коэффициенты {ai} позволяют соизмерять эффективности использования игроками ресурсов на одном и том же объекте.

Выигрыши игроков в вероятностной модели определяются следующим образом:

 

(3)

Равновесием Нэша в чистых стратегиях (x*, y*) является пара векторов, удовлетворяющих условиям (1), таких, что (x, y), также удовлетворяющих условиям (1), выполнено

Fx(x*, y*) ≥ Fx(x, y*), Fy(x*, y*) ≥ Fy(x*, y). (4)

В рамках вероятностной модели найдено равновесие в чистых стратегиях для случая Xi = Yi при произвольных ri (0; 1], ai > 0, i  N, заключающееся в равном распределении имеющихся у них ресурсов между объектами. [2]

6. Модель распределенного преодоления системы обороны (так называемая задача о диффузной бомбе)

Одной из современных тенденций в теории и практике управления является стремление к «миниатюризации», «децентрализации» и «интеллектуализации». Как следствие, в последнее десятилетие все большее внимание исследователей привлекает такой объект управления, как мультиагентные системы, состоящие из большого числа взаимодействующих между собой автономных агентов социальной, технической или информационной природы. Такие свойства мультиагентных систем, как децентрализованность взаимодействия и множественность агентов, с одной стороны, дают их качественно новые свойства, важные во многих приложениях, в том числе – в задачах оборон и безопасности (колесные и др. роботы, беспилотные летательные аппараты, автономные подводные аппараты и т.п.). С другой стороны, новые свойства объекта управления ставят новые задачи – в частности, необходимость совместного решения задач управления, реализации вычислений и организации коммуникаций (связи) в реальном времени.

Примером является задача о диффузной бомбе, которая заключается в следующем: группа автономных подвижных агентов должна поразить цель с заданными координатами. В каждый такт времени каждый агент может быть с определенной вероятностью обнаружен и уничтожен системой обороны. Вероятность обнаружения/уничтожения зависит от координат агента, его скорости и расположения относительно других агентов.

Задача заключается в синтезе таких алгоритмов децентрализованного взаимодействия агентов и принятия ими решений о направлении и скорости движения, чтобы максимизировать число агентов, достигших цели. «Интеллектуальность» агентов заключается, в том числе, в том, что часть агентов-разведчиков, может оперативно получать информацию о параметрах системы обороны. Остальные агенты, наблюдая за поведением разведчиков (в условиях ограничений на коммуникации между агентами), «рефлексируя» получают оценку опасной области и решают поставленную задачу. [4]

7. Применение теории игр. «Танковые бои»

Рассмотрим бой двух групп, каждая из которых состоит из двух танков, причем каждый из них видит оба танка противника. Бой происходит следующим образом. Сначала танки первой группы производят залп по танкам второй группы, после этого уцелевшие танки второй группы проводят залппо танкам первой группы и т. д.

Результаты стрельбы наблюдаются, поэтому по пораженным танкам огонь не ведется. Вероятность поражения танка первой стороны одним выстрелом Рпр, второй — Р.

Обе группы назовем системой. Эта система может быть в разных состояниях: по два танка у каждой стороны, по одному у каждой и т. д. Обозначим условно эти состояния следующим образом: 2,2; 1,1 и т. д., где первая цифра означает число танков у первой стороны, вторая — то же самое у второй.

До начала боя система находится в состоянии 2,2. После залпа первой стороны возможно сохранение состояния 2,2 (оба танка первой стороны промахнулись) или переход ее в состояния 2,1 и 2,0. Нетрудно, пользуясь методами теории вероятностей, вычислить вероятности этих переходов:

P(2,2 2,2) = (1 – P)2

P(2,2 2,1) = 2(1 – P)P

P(2,2 2,0) = P2

Переходы из одного состояния в другое удобно изображать графически. На Рисунке 1. показаны возможные состояния после первого и второго залпов.

Рисунок 1

Как видно из схемы, мы имеем дело с ветвящимся процессом, характерным свойством которого является независимость вероятностей перехода из одного состояния в другое от предыдущих переходов. Такие процессы называются марковскими ветвящимися процессами.

Важнейшей характеристикой марковских ветвящихся процессов является матрица вероятностей перехода из одного состояния в другое:

Р=(рiк), где рiк – вероятность перехода из состояния Ei в состояние Ek.

P – квадратная матрица с неотрицательными элементами, причем сумма элементов каждой строки равна 1.

Для случая залпа первой стороны эта матрица имеет вид представленный в Таблице 1.

Таблица 1

Состояние до залпа

Состояние после залпа

2,2

2,1

2,0

1,2

1,1

1,0

0,2

0,1

2,2

(1-Р) 2

2(1-Р)Р

Р2

0

0

0

0

0

2,1

0

(1-Р) 2

2Р(1-Р)2

0

0

0

0

0

2,0

0

0

1

0

0

0

0

0

1,2

0

0

0

1-Р

Р

0

0

0

1,1

0

0

0

0

1-Р

Р

0

0

1,0

0

0

0

0

0

1

0

0

0,2

0

0

0

0

0

0

1

0

0,1

0

0

0

0

0

0

0

1

Аналогичным образом можно вычислить и матрицу вероятностей перехода при залпе второй стороны. Таблица 2.

Таблица 2.

Состояние до залпа

Состояние после залпа

2,2

2,1

2,0

1,2

1,1

1,0

0,2

0,1

2,2

(1-р) 2

0

0

2р(1-р)

0

0

р2

0

2,1

0

1-р

0

0

р

0

0

0

2,0

0

0

1

0

0

0

0

0

1,2

0

0

0

(1-р) 2

0

0

2р(1-р)+р2

0

1,1

0

0

0

0

1-р

0

0

р

1,0

0

0

0

0

0

1

0

0

0,2

0

0

0

0

0

0

1

0

0,1

0

0

0

0

0

0

0

1

Пользуясь этими матрицами и изображением марковской цепи, можно рассчитать вероятность любого состояния системы после любого числа залпов.

Пример. Вычислим вероятности состояний системы при условии

Р = р = 0,5 после 1, 2, 3, 4-го этапов боев (под этапом понимается проведение двух залпов — по одному с каждой стороны) и предельные их значения при очень большом числе залпов. Результаты расчетов показаны в Таблице 3.

Таблица 3

Состояния

Вероятность состояния после залпов с 2-х сторон

1-го

2-го

И т.д.

Стремление к ∞

2,2

0,0625

0,004

0,000

2,1

0,25

0,047

0,000

1,2

0,125

0,023

0,000

1,1

0,25

0,141

0,000

2,0

0,25

0,453

0,445

1,0

-

0,125

0,244

0,2

0,0625

0,113

0,173

0,1

-

0,094

0,138

После первого этапа (залпа):

Р(2;2)=(1-Р)2*(1-р) 2=(0,5) 2*(0,5) 2=1/16=0,0625

Р(2;1)=2Р*(1-Р)*(1-р)=0,5*0,5=0,25

Р(1;2)=(1-Р) 2*2Р*(1-р)=0,25*0,5=0,125

Р(1;1)=2*(1-Р)Р*р=0,5*0,5=0,25

Р(2;0)=Р2*1=0,25

Р(0;2)=(1-Р) 2р2=0,25*0,25=0,0625

После второго этапа (залпа):

Р(2;2)=(1/16)(1-Р)2*(1-р)2=0,06252=1/256=0,0039(приблизительно)=0,004

P(2;1)=0,0625(2(1-P)P)(1-p)+0,25(1-Р)2*(1-р)=0,046

P(1;2)= (1/16)(1-Р)2*(1-р)+0,125(1-P)(1-р) 2=(приблизительно)= 0,023

P(1;1)=0,0625(2(1-P)P)p+0,125P(1-p)+0,25(1-Р)2*р+0,25(1-P)*

(1-p)=(пр.)=0,140

P(2;0)=0,0625 Р2*1+0,25*((1-Р)+Р2)*1+0,25*1*1=(пр.)=0,453

P(1;0)=0,25P*1=0,125

P(0;2)= (1/16)(1-Р)2* p2+0,125(1-P)(2р(1-р)+р2)+0,0625*1*1=(пр.)=0,113

P(0;1)=0,125P*p+0,25*(1-P)p=(пр.)=0,094

Анализ этой Таблицы 3. позволяет сделать ряд выводов. Вероятности всех состояний, в которых присутствуют танки обеих сторон, с течением боя быстро убывают и стремятся к нулю. Эти состояния называют несущественными.

Вероятности состояний, в которых присутствуют единицы только одной стороны, стремятся к определенному пределу.

Вероятность победы первой стороны (она равна сумме вероятностей состояний 2,0 и 1,0) равна 0,689, т. е. значительно превосходит вероятность победы второй стороны 0,311, несмотря на то, что исходное число танков и их эффективности одинаковы.

Этот пример показывает большую роль нанесения упреждающего удара. В данном случае упреждение в ударе оказывается эквивалентным более чем двукратному увеличению эффективности.

Р(2,2  2,2) = (1 – Р )2(1 – Рпр)2

8. Компьютерное моделирование боевых действий

Сегодня назрела острая необходимость замены части натурных испытаний образцов вооружений и военной техники имитационными экспериментами и компьютерными моделями, поскольку их использование в качестве замены некоторой доли натурных испытаний позволяет экономить существенные материально-технические ресурсы, а в ряде случаев и проводить виртуальные испытания, натурный аналог которых осуществить невозможно.

Имея в своём распоряжении компьютерные модели, оборонное ведомство может спланировать и проанализировать замысел предстоящей реальной операции. При этом её участники будут максимально погружены в условия обстановки, с которой им предстоит столкнуться, применяя имитационные модели. Многократно разыгрывая различные сценарии ведения боевых действий, можно уяснить сильные и слабые места самого замысла, попутно вырабатывая у личного состава необходимые навыки.

При разработке систем компьютерного информационного моделирования нужно понимать, что система должна обеспечивать решение следующих военно-прикладных задач:

учитывать влияние параметров боевой обстановки на результаты боевых действий;

исследовать эффективность применения противником различных способов и тактических приемов;

исследовать эффективность применения различных способов и тактических приемов борьбы с противником.

Для успешной реализации систем компьютерного моделирования необходимо создание единого информационного пространства ВС РФ, единых стандартов языка описания моделирующего пространства, метаданных, сценариев. На сегодняшний день отсутствует единый язык, на котором системы могли бы взаимодействовать различные информационно-моделирующие системы. Использование ИМС может существенно повысить качество принятия решений. Возможность комплексного анализа локальной тактической ситуацию на ближайшую перспективу позволяет увидеть заведомо проигрышное решение и исключить негативное развитие ситуации.

Заключение

В заключение следует особо подчеркнуть, что теория игр является очень сложной областью знания. При обращении с ней надо соблюдать известную осторожность и четко знать границы применения. Применение теории игр облегчает нам понимание сущности происходящего, а многогранность данного раздела науки позволяет нам успешно использовать методы и свойства этой теории в различных областях нашей деятельности.

Моделирование игр стало очень популярным в разработке военных стратегий. Теория игр может использоваться при планировании боевых действий различных видов и масштабов, распределении сил противников на нескольких независимых участках боя, распределении ограниченных ресурсов боевых средств.

Теория игр прививает человеку дисциплину ума. От лица, принимающего решения, она требует систематической формулировки возможных альтернатив поведения, оценки их результатов, и самое главное - учета поведения других объектов. Человек, знакомый с теорией игр, реже считает других глупее себя, - и потому избегает многих непростительных ошибок. Знание основ теории игр не дает нам явного выигрыша, но оберегает нас от свершения глупых и ненужных ошибок. Теория игр всегда имеет дело с особым типом мышления, стратегическим.

Список используемых источников

1. Дж. фон Нейман, О. Моргенштерн. «Теория игр и экономическое поведение», Наука, 1970.

2. Глушков И.Н. Выбор математической схемы при построении модели боевых действий // Программные продукты и системы. – 2010. – №10

3. Михалев С.Н. Военная стратегия. Подготовка и ведение войн Нового и Новейшего времени. – М.: Кучково поле, 2003

4. Новиков Д. А., «Иерархические модели военных действий», УБС, 37 (2012), 25–62; Autom. Remote Control, 74:10 (2013)

5. Паньковский Ю.И., Бобин А.В., Слатин А.В. Технология построения имитационной математической модели воспроизведения хода боевых действий // Труды конференции «Имитационное моделирование. Теория и практика». – Т. 1. – СПб: СПИИРАН, 2011.

6. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. – М.: Высшая школа, 1998.

7. Раскин М. А. «Введение в теорию игр» // Летняя школа «Современная математика». – Дубна: 2008

Просмотров работы: 712