Граф рефлексивной игры. Игры на рефлексию Нормирование действий игроков, ауторефлексия и рефлексивное состояние

Новиков Д.А., Чхартишвили А.Г.
Рефлексивные игры
М.: СИНТЕГ, 2003.- 160 с.

Материалы предоставлены сайтом "Теория управления организационными системами "

Аннотация

Монография посвящена обсуждению современных подходов к математическому моделированию рефлексии. Авторы вводят в рассмотрение новый класс теоретико-игровых моделей - рефлексивные игры, описывающие взаимодействие субъектов (агентов), принимающих решения на основании иерархии представлений о существенных параметрах, представлений о представлениях и т.д.

Анализ поведения фантомных агентов, существующих в представлениях других реальных или фантомных агентов, и свойств информационной структуры, отражающей взаимную информированность реальных и фантомных агентов, позволяет предложить в качестве решения рефлексивной игры информационное равновесие, которое является обобщением ряда известных концепций равновесия в некооперативных играх.

Рефлексивные игры дают возможность:

Моделировать поведение рефлексирующих субъектов;
- исследовать зависимость выигрышей агентов от рангов их рефлексии;
- ставить и решать задачи рефлексивного управления;
- единообразно описывать многие явления, связанные с рефлексией: скрытое управление, информационное управление через СМИ, рефлексию в психологии, художественных произведениях и др.

Книга адресована специалистам в области математического моделирования и управления социально-экономическими системами, а также студентам вузов и аспирантам.

ВВЕДЕНИЕ
ГЛАВА 1. Информация в принятии решений
1.1. Индивидуальное принятие решений: модель рационального поведения
1.2. Интерактивное принятие решений: игры и равновесия
1.3. Общие подходы к описанию информированности
ГЛАВА 2. Стратегическая рефлексия
2.1. Стратегическая рефлексия в играх двух лиц
2.2. Рефлексия в биматричных играх
2.3. Ограниченность ранга рефлексии
ГЛАВА 3. Информационная рефлексия
3.1. Информационная рефлексия в играх двух лиц
3.2. Информационная структура игры
3.3. Информационное равновесие
3.4. Граф рефлексивной игры
3.5. Регулярные структуры информированности
3.6. Ранг рефлексии и информационное равновесие
3.7. Рефлексивное управление
ГЛАВА 4. Прикладные модели рефлексивных игр
4.1. Скрытое управление
4.2. СМИ и информационное управление
4.3. Рефлексия в психологии
4.3.1. Психология шахматного творчества
4.3.2. Трансакционный анализ
4.3.3. Окно Джохари
4.3.4. Модель этического выбора
4.4. Рефлексия в художественных произведениях
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА

Электронная версия книги: [Скачать, PDF, 29 стр., 250 Кбайт ].

Для просмотра книги в формате PDF требуется программа Adobe Acrobat Reader, новую версию которой можно бесплатно скачать с сайта компании Adobe.

Если структура информированности имеет конечную сложность, то можно построить граф рефлексивной игры, наглядно показывающий взаимосвязь между действиями агентов (как реальных, гак и фантомных), участвующих в равновесии.

Вершинами этого ориентированного графа являются действия г е ?+, отвечающие попарно нетождественным структурам информированное™ /., или компоненты структуры информированности в„ или просто номер г реального или фантомного агента, г е Z+.

Между вершинами проведены дуги по следующему правилу: к каждой вершине х ы проведены дуги от (п - 1) вершин, отвечающих структурам I mp j е N {/} Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.

Подчеркнем, что граф рефлексивной игры соответствует системе уравнений (2.3.1) (то есть определению информационного равновесия), в то время как решения ее может и не существовать.

Итак, граф G, рефлексивной игры Г, (см. определение рефлексивной игры в предыдущем разделе), структура информированности которой имеет конечную сложность, определяется следующим образом:

- вершины графа G t соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетождественным структурам информированности;
- дуги графа G t отражают взаимную информированность агентов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом.

Если в вершинах графа G/ изображать представления соответствующего агента о состоянии природы, то рефлексивная игра Г, с конечной структурой информированности / может быть задана кортежем Г, = {N, (А)), е N,f{ ), e ,v, G/}, где N - множество реальных агентов, X, - множество допустимых действий z"-го агента, f{-) 0 х X -> 9?" - его целевая функция, /" е N, G,- граф рефлексивной игры.

Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа G/, а не дерева информационной структуры.

Рассмотрим несколько примеров нахождения информационного равновесия.

Примеры 2.4.1-2.4.3. В этих примерах участвуют три агента с целевыми функциями следующего вида:

гдеXi> 0, / € N= (1, 2, 3}; в е 0 = {1, 2}.

Для краткости будем называть агента, считающего, что спрос низкий (0= 1), пессимистом, а считающего, что спрос высокий (0 = 2) - оптимистом. Таким образом, в примерах 2.4.1-2.4.3 ситуации различаются лишь вследствие различных структур информированности.

Пример 2.4.1. Пусть первые два агента оптимисты, а третий - пессимист, причем все трое одинаково информированы. Тогда, в соответствии с утверждением 2.2.5, для любого а е I выполняются тождества / ст] = / ь / ст2 = h, Дз = h-

В соответствии со свойством 2 определения информационного равновесия, х*.

Видно, что любая структура информированности тождественна одной из трех, образующих базис: {/ ь / 2 , Д}. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 8.

Рис. 8.

Таким образом, действия агентов в ситуации информационного равновесия будут следующими: X! = х 2 =1/2, =0.*

Пример 2.4.2. Пусть первые два агента оптимисты, а третий - пессимист, который считает всех грех агентов одинаково информированными пессимистами. Первые два агента одинаково информированы, причем оба они адекватно информированы о третьем агенте.

Имеем: I x ~ I 2 , I > h, h > h, 1 ~з I 2 ~з h ? Граф рефлексивной игры изображен на Рис. 9.

Рис. 9.

Эти условия можно записать в виде следующих тождеств, имеющих место для любого ае I (воспользуемся соответствующими определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

12а = ha, 1Ъа = ha, ha = ha, hla = ha, ha = h, ha2 = hi, hal = h-

Аналогичные соотношения выполняются для равновесных действий х„ . Левые части этих тождеств показывают, что любая структура 1 п при |сг|>2 тождественна некоторой структуре /„ |г|

Таким образом, сложность данной структуры информированности равна пяти, а глубина равна двум.

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

Таким образом, действия реальных агентов в ситуации информационного равновесия будут следующими: Х) =х 2 =9/20, х 3 * = 1/5.

Пример 2.4,3. Пусть все трое агентов оптимисты, первый и второй взаимно информированы, второй и третий также взаимно информированы. По мнению первого агента, третий считает всех троих одинаково информированными пессимистами; также и первый агент, по мнению третьего, считает всех троих одинаково информированными пессимистами.

Имеем: Д х Д, / 2 >

Эти условия можно записать в виде следующих тождеств, имеющих место для любого а е I (воспользуемся соответствующими определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

Аналогичные соотношения выполняются для равновесных действий х п.

Левые части этих тождеств показывают, что любая структура 1 П при |oj > 3 тождественна некоторой структуре /„ |т| 1, А, /3, /зь /13, /вь /132? hn, /зв-

Таким образом, базис образуют следующие попарно различные структуры: {/ ь />, /3, /зь /в, /lb}- Сложность данной структуры информированности равна шести, а глубина равна трем. Граф соответствующей рефлексивной игры изображен на Рис. 10.

Рис. 10.

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

Таким образом, действия реальных агентов в ситуации информационного равновесия будут следующими: х, = х 3 =17/35, х 2 * = 12/35.

Завершив описание графа рефлексивной игры, продолжим исследование свойств информационного равновесия.

Чтобы пользоваться предварительным просмотром создайте себе аккаунт (учетную запись) Google и войдите в него: https://accounts.google.com

Предварительный просмотр:

Итоговый отчёт о проделанной работе по реализации плана «Рефлексивный круг» в рамках социализации

Рефлексия – размышление человека, направленное на анализ самого себя (самоанализ) – собственных состояний, своих поступков и прошедших событий. (ФОТОГРАФИЯ С КОСМОСА)

«Рефлексивный круг» – это технология, которая позволяет развивать речь дошкольников, мысли детей. Круг способствует совершенствованию речи, как средства общения, помогает детям высказывать предположения, делать простейшие выводы.

На ежедневных рефлексивных кругах в группах дошкольного возраста, воспитатель задает вопросы, на которые дети активно отвечают.

(ФОТО)

За время проведения ежедневных рефлексивных кругов в течение года, дети научились внимательно слушать воспитателя и своих сверстников, не перебивать друг друга.

(ФОТО)

Дети научились пользоваться правилами, которые изображены на пиктограммах и находятся в каждой группе на уровне глаз детей.

(ФОТОГРАФИИ пиктограмм)

Начиная с младшей группы «рефлексивный круг» проводится каждый день перед завтраком со всеми детьми, присутствующими в группе. Целью этого круга обсуждение планов на день или каких-либо проблем группы. Если того требуют обстоятельства, например, в группе произошло какое-то событие, то «рефлексивный круг» может проводиться ещё раз сразу после происшествия.

Круг проводится в одном и том же месте, для того чтобы в будущем дети привыкли обсуждать свои проблемы в кругу без присутствия воспитателя, в данном случае круги проводились в группе на ковре. Для эффективности обсуждения во время кругов используем свечу, которая ставится в центр круга, и любой предмет, которую дети передают друг другу во время ответов на вопросы, что помогает детям концентрироваться на выслушивание ответов и не перебивать друг друга.

Так же рефлексивные круги проводятся после клубных часов. На этих кругах можно узнать и понять, что детям понравилось, и что не понравилось во время проведения клубного часа.

(ФОТО С КОСМОСА И ФОТО КРУГОВ)

Помимо запланированных, темы «Кругов рефлексии» определялись воспитателем по обстоятельствам, например, если в группе произошло какое-то событие.

В итоге к концу учебного года многие дети овладели навыками связной речи, умение излагать свои мысли. Сформированы навыки слушать друг друга. Большинство детей желает выразить свои чувства и переживания.

Сентябрь

Ситуация месяца «Мой детский сад»

п/п	Участники	Дата проведения
		4.09.2017	Кого мы называем друзьями? О каком друге ты мечтаешь?
		18.09.2017	Какого цвета дружба?
	Средние группы	11.09.2017	С кем я хотел бы дружить в группе? Как мы делим игрушки?
	Средние группы	25.09.2017	Кто такой воспитатель?
Октябрь Ситуация месяца «Моя Родина»
	Старшие и подготовительные группы	4.10.2017	Насколько хорошо я знаю свой город? За что я люблю свой город?
		18.10.2017
		31.10.2017	Детская площадка в моем городе. Чем заняться в выходные? Любимое место в Москве моих родителей. И почему?
	Средние группы	11.10.2017	А у нас во дворе? Детская площадка в моем городе.
	Средние группы	25.10.2017	Куда я хожу с родителями?

Ноябрь

Ситуация месяца «Я – житель Земного шара»

п/п	Участники	Дата Проведения
	Старшие и подготовительные группы	8.11.2017	Какие страны я знаю? В какой стране хотел бы побывать?
	Старшие и подготовительные группы	22.11.2017	Как себя вести при встрече с иностранцем?
	Средние группы	15.11.2017	Страна, где я живу.
	Средние группы	29.11.2017	Мои любимые песни, игры, мультфильмы. Сказочная страна.

2017-18 уч. года)

Ситуация месяца «Новый год. Волшебные подарки»

Старшие и подготовительные группы	6.12.2017	Как и чем можно украсить елочку в Новый год? Моё новогоднее желание. Что такое чудо?
	20.12.2017	Как нужно вести себя на утренниках? Как организовать свой досуг?
	10.01.2018	Как помочь птицам зимой?
Младшие и средние группы	6.12.2017	Как и чем можно украсить елочку в Новый год? Моё новогоднее желание.
Младшие и средние группы	20.12.2017	Как нужно вести себя на утренниках?

2018 уч. года)

Ситуация месяца «Мальчики и девочки»

п/п	Участники	Дата проведения
	Старшие и подготовительные группы	24.01.2018	Кто такая девочка? Кто такой мальчик? Различие признаков.
	Старшие и подготовительные группы	7.02.2018	Что влияет на наше настроение?
	Средние группы	31.01.2018	Зачем мы питаемся?
	Средние группы	14.01.2018	Какие добрые поступки можно сделать по отношению к мальчикам? Какие добрые поступки можно сделать по отношению к девочкам?
2018 уч. года) Ситуация месяца «Моя семья. Мои корни»
	Старшие и подготовительные группы	21.02.2018	Что такое семья?
		28.02.2018	За что я люблю свою семью?
		7.03.2018	Кем работают родители?
	Средние группы	28.02.2018	Что значит дружная семья?
	Средние группы	14.03.2018	Кто живёт с тобой дома?

2018 уч. года)

Ситуация месяца «Весна красна»

п/п	Участники	Дата проведения
	Старшие и подготовительные группы	21.03.2018	Какие происходят изменения в природе весной?
	Старшие и подготовительные группы	4.04.2018	Что происходит весной с деревьями?
	Средние группы	Старшие и подготовительные группы	10.04.2018	Что мы знаем о космосе?
	Средние группы	Старшие и подготовительные группы	18.04.2018	Что мы знаем о планете Земля?
	Средние группы	11.04.2018	Кто первый космонавт?
	Средние группы	25.04.2018	Планета, на которой мы живём. 8.05.2018	Великий праздник «День Победы».Какая наша Родина – Россия?
23.05.2018	Какая наша Родина – Россия?
	Средние группы	2.05.2018	Что ты знаешь о празднике «Великой победы»?
	Средние группы	16.05.2018	Кто мы жители страны России?

Итог «Рефлексивных кругов» за год:

Дети умеют вежливо общаться друг с другом и с окружающими взрослыми. Умеют вести диалог, при этом используют различные средства выразительности. Дети внимательно слушают друг друга и понимают.

ПОДВЕДЕНИЕ ИТОГОВ ДЕЛА (РЕФЛЕКСИЯ)

«ДЕРЕВО НАСТРОЕНИЙ»

На листе ватмана рисуется дерево – каждая веточка – это отдельный день. Вечером ребенок на сегодняшней веточке может нарисовать листочек одного из трех цветов. зеленый означает, что настроение у ребенка отличное, желтый – хорошее, красный – так себе. К концу смены у вас появится полная картина того, как она прошла для ваших детей.

«С НЕБА ЗВЕЗДОЧКА УПАЛА»

Детям говорится о том, что, когда падают звезды, можно загадывать желание и многие люди, вувидев падающую звезду, загадывают самое заветное желание и оно обязательно сбывается. Ребята пишут на своей звезде (вырезанной из картона), чего они ждут от этой смены. Вожатый собирает все звезды и вешает их на стену. В конце смены их снимают, читают пожелания и вместе обсуждают, что сбылось, а что нет

«ЧЕМОДАНЧИК В ДОРОГУ»

В волшебный чемоданчик можно положить что угодно и оно сохранится в неизменном виде. Каждый выбирает три вещи, которые он хотел бы унести с занятия: хорошее настроение, друга, стул, на котором он сидит.

«ЗАКОНЧИТЕ ПРЕДЛОЖЕНИЕ»

Сегодняшний день - это:

Мое настроение сегодня:

Я хотел бы, чтобы завтра:

Опираясь на высказывания детей, вожатый подводит итог дня.

Попрощаемся как на Адаманских островах в Тихом океане.

Положите правую ладошку под ладошку соседа справа; а левую - на ладошку соседа слева. И с самыми добрыми и светлыми пожеланиями, с самой положительной энергией дуем на ладошку соседа справа.

“Конверт откровений”

Вожатый заранее заготавливает конверт с большим количеством вопросов. Желательно, чтобы вопросы носили нравственно-этический характер, типа:

что ты больше всего ценишь в людях?

какая твоя самая большая цель в жизни?

какие черты характера человека тебе особенно неприятны?

на кого из известных героев прошлого (фильма, книги) ты хотел бы быть похожим и почему? и т.д.

"По одежке встречают …"

Этот этап работы вызывает интерес и легкое волнение у членов группы. В процессе поиска своего «портрета» им приходится прочитать не один, а несколько листочков, «поспорить» с кем-то из претендентов за одну и ту же характеристику, суметь отстоять свое право на нее. При обсуждении ведущий предлагает ответить на несколько вопросов:

Удовлетворены ли вы тем, что написано на полученном листочке?

Что вызвало удивление, произошли ли «открытия»?

Что вызвало наибольший интерес в процессе работы?

Какие трудности испытывали при выполнении упражнения?

Гороскоп

2-3 день смены.

Дети распределяются по группам - знакам зодиака. Перед высказыванием - краткая характеристика знака. Необычная характеристика детей, форма запоминания личности через выделение необычных качеств. Можно сравнивать по сезонам года, цвету глаз и т.д.

Уровень отряда -- низкий.

Ситуативный

(Электрический стул)

Один участник находится спиной к аудитории, все пишут записки с краткой характеристикой этого человека, которые потом зачитываются ведущим (корректирующим текст в случае его некорректности по отношению к человеку).

Дает возможность дать оценку поведения того или иного ребенка членам отряда без амбиций, обид, оскорблений его личного достоинства.

Свеча - прожитый день.

Ребята садятся в круг и, передавая свечку друг другу, рассказывают по очереди, как прошел для них день и оценка его.

Свеча - желание.

Передавая свечку по кругу, к обычной оценке дня можно добавить свои пожелания на завтра. Можно начать словами: "Я бы хотела, чтобы завтра…"

Паутинка.

Все садятся в круг. Вожатый берет клубок ниток, наматывает нитку на свой палец и передает этот клубок любому ребенку из круга ("Я хотел бы передать этот клубок Кате, потому что…"). Далее второй участник наматывает свою ниточку на палец, и передает клубок следующему, объясняя свой выбор. И так далее, пока все не будут связаны одной ниточкой. Можно увидеть те связи, которые возникли между ребятами в отряде. Каждый может отрезать, намотанную на палец ниточку на память.

«Пять минут откровения»

Весь отряд в течение всего дня складывает в коробку в виде почтового ящика записки с вопросами, которые они хотели бы задать своим вожатым на итоговом «огоньке». На «огоньке» на эти вопросы отвечают вожатые.

«Записки»

Изготавливаются конверты и маленькие записочки. Количество конвертов равно количеству детей в отряде. На записках каждый ребёнок пишет пожелания, слова благодарности, впечатления от каждого человека из отряда. Эти записки вкладываются в конверты, которые творчески оформлены и подписаны. Затем эти конверты в творческой форме вручаются их владельцам. Но только на следующий день разрешается открыть конверты и прочитать записки.

Наряду с рефлексивными играми возможным методом теоретико-игрового моделирования в условиях неполной информированности являются байесовы игры, предложенные в конце 60-х годов XX в. Дж. Харшаньи . В байесовых играх вся частная (т. е. не являющаяся общим знанием) информация, имеющаяся у агента на момент выбора им своего действия, называется типом агента. При этом каждый агент, зная свой тип, имеет и предположения о типах остальных агентов (в виде вероятностного распределения). Формально байесова игра описывается следующим набором:

- множеством N агентов;
- множествами /?, возможных типов агентов, где тип /-го агента

Множеством X’ = J - [ X х допустимых векторов действий аген-

-набором целевых функций /: R’x X ’-> 9? 1 (целевая функция агента зависит в общем случае от типов и действий всех агентов);
- представлениями F,(-|r,) е Д(/?_,), /" е N, агентов (здесь через /?_, обозначено множество всевозможных наборов типов всех агентов, кроме /-го, R.j = П R t , а через Д(/?_,) обозначено множесг-

во всевозможных вероятностных распределений на /?_,). Решением байесовой игры является равновесие Байеса-Нэша, определяемое как набор стратегий агентов вида х *: R, -> X h i е N,

которые максимизируют математические ожидания соответствующих целевых функций:

где jcобозначает набор стратегий всех агентов, кроме /-го. Подчеркнем, что в байесовой игре стратегией агента является не действие, а функция зависимости действия агента от его типа.

Модель Дж. Харшаньи можно интерпретировать различным образом (см. ). В соответствии с одной интерпретацией все агенты знают априорное распределение типов F{r) е Д(R ’) и, узнав собственный тип, вычисляют из него по формуле Байеса условное распределение Fj(r.i | г,). В этом случае представления агентов {F,(-|-)}, sW называются согласованными (и, в частности, являются общим знанием - каждый агент может их вычислить, знает, что эго могут сделать остальные и т. д.).

Другая интерпретация состоит в следующем. Пусть существует некоторый набор потенциальных участников игры всевозможных типов. Каждый такой «потенциальный» агент выбирает свою стратегию в зависимости от своего типа, после чего случайным образом выбирается п «актуальных» участников игры. В этом случае представления агентов, вообще говоря, не обязательно согласованы (хотя и являются общим знанием). Отметим, что в эта интерпретация названа игрой Зельтена (Р. Зельген - лауреат Нобелевской премии по экономике 1994 года, вместе с Дж. Нэшем и Дж. Харшаньи).

Теперь рассмотрим ситуацию, когда условные распределения не обязательно являются общим знанием. Удобно описывать ее следующим образом. Пусть выигрыши агентов зависят от их действий и от некоторого параметра в е 0 («состояния природы», которое может интерпретироваться и как набор типов агентов), значение которого не является общим знанием, т. е. целевая функция /-го агента имеет вид f i {0,x x ,...,x n): 0 х X’ -» "Л 1 , /" е N. Как было отмечено во второй главе данной работы, выбору агентом своей стратегии логически предшествует информационная рефлексия - размышления агента о том, что каждый агент знает (предполагает) о параметре 0, а также о предположениях других агентов и пр. Тем самым, мы приходим к понятию структуры информированности агента, отражающей его информированность о неизвестном параметре, о представлениях других агентов и т. д.

В в рамках вероятностной информированности (представления агентов включают в себя следующие компоненты: вероятностное распределение на множестве состояний природы; вероятностное распределение на множестве состояний природы и распределениях на множестве состояний природы, характеризующих представления остальных агентов, и т. д.) было построено универсальное пространство возможных взаимных представлений (universal beliefs space). При этом игра формально сводится к некоей «универсальной» байесовой игре, в которой типом агента является вся его структура информированности. Однако предложенная в конструкция настолько громоздка, что найти решение «универсальной» байесовой игры в общем случае, по-видимому, невозможно.

В данном разделе мы ограничимся рассмотрением игр двух лиц, при этом представления агентов задаются точечной структурой информированности (у агентов имеются вполне определенные представления о значении неопределенного параметра; о том, каковы представления (также вполне определенные) оппонента, и т. д.) С учетом этих упрощений нахождение равновесия Байеса-Нэша сводится к решению системы двух соотношений, определяющих две функции, каждая из которых зависит от счетного числа переменных (см. ниже).

Итак, пусть в игре участвуют два агента с целевыми функциями

причем функции f и множества Х ь 0 являются общим знанием. Первый агент имеет следующие представления: неопределенный параметр равен 0 е 0; второй агент считает, что неопределенный параметр равен в ]2 е 0; второй агент считает, что первый агент считает, что неопределенный параметр равен в 2 е 0 и т. д. Таким образом, точечная структура информированности первого агента /, задается бесконечной последовательностью элементов множества 0; пусть, аналогично, и у второго агента имеется точечная структура информированности 1 2:

Посмотрим теперь на рефлексивную игру (2)-(3) с «байесовой» точки зрения . Типом агента в данном случае является его структура информированности /, /=1, 2. Для нахождения равновесия Байеса-Нэша необходимо найти равновесные действия агентов всевозможных типов, а не только некоторых фиксированных типов (3).

Легко видеть, какими будут в данном случае распределения F,(-|-) из определения равновесия (1). Если, например, тип первого агента 1={6, 0 !2 , 0ш, ...), то распределение Fi(-|/i) приписывает вероятность 1 типу оппонента / 2 =(0 | 2 , 012ь 0Ш2, ) и вероятность О остальным типам. Соответственно, если тип второго агента ^2 = (02> $2ь Фиг* )> то распределение F 2 (-|/ 2) приписывает вероятность 1 типу оппонента 1=(в 2 , 0 212 , 02:2и ) и вероятность 0 остальным типам.

Для упрощения записи будем использовать в дальнейшем следующие обозначения:

Введем также обозначения

В этих обозначениях точечное равновесие Байеса-Нэша (1) записывается как пара функций {(pi-), i//(-)), удовлетворяющих условиям

Заметим, что в рамках точечной структуры информированности 1-й агент уверен, что значение неопределенного параметра равно 0, (вне зависимости от представлений оппонента).

Таким образом, для нахождения равновесия необходимо решить систему функциональных уравнений (4) для определения функций (р(-) и!//( ), каждая из которых зависит от счетного числа переменных.

Возможные структуры информированности могут иметь конечную либо бесконечную глубину. Покажем, что применение концепции равновесия Байеса-Нэша к агентам со структурой информированности бесконечной глубины дает парадоксальный результат - для них равновесным является любое допустимое действие.

Определим понятие конечности глубины структуры информированности применительно к случаю игры с двумя участниками, когда структура информированности каждого из них является бесконечной последовательностью элементов из 0.

Пусть даны последовательность Т= {t j } " =[ элементов из 0 и целое неотрицательное число к. Последовательность (о к {Т)= {t t } /=i+1

будем называть к-окончанием последовательности Т.

Будем говорить, что последовательность Т имеет бесконечную глубину, если для любого п найдется к>п такое, что последовательность со к (Т) не совпадает (имеется в виду обычное поэлементное совпадение) ни с одной из последовательностей набора а>и(Г)=Т, (0 (Т),..., (о п (Т). В противном случае последовательность Т имеет конечную глубину.

Иначе говоря, последовательность конечной глубины имеет конечное число попарно различных окончаний, в то время как у последовательности бесконечной глубины их бесконечно много. Например, последовательность (1, 2, 3, 4, 5, ...) имеет бесконечную глубину, а последовательность (1, 2, 3, 2, 3, 2, 3, ...) - конечную.

Рассмотрим игру (2), в которой целевые функции f, f 2 и множества Х, Х 2 , 0 обладают следующим свойством:

(5) для любых Л"| е Х, х 2 е Х 2 , в е 0 множества

Условия (5) означают, что для любого в е © и любого действия Xi е Х у второго агента существует хотя бы один наилучший ответ и, в свою очередь, само действие Х является наилучшим ответом на какое-то действие второго агента; аналогично и любое действие

Х 2 G Х 2 .

Оказывается, что при выполнении условий (5) в игре (2) любое действие агента со структурой информированности бесконечной глубины является равновесным (г. е. является компонентой некоторого равновесия (4)). Эго справедливо для обоих агентов; для определенности сформулируем и докажем утверждение для первого.

Утверждение 2.10.1 .Пусть в игре (2), в которой выполнены условия (5), существует хотя бы одно точечное равновесие Байеса- Нэша (4). Тогда для любой структуры информированности бесконечной глубины 1 и любого % е Х существует равновесие (*,*( )> х*(-)), в котором х*(/,) =х-

Идея доказательства состоит в конструктивном построении соответствующего равновесия. Зафиксируем произвольное равновесие (1. В силу условий (4) значение функции ф ( ) принимала на структуре 1 значение х-

Доказательству утверждения 2.10.1 предпошлем четыре леммы, для формулировки которых введем обозначение: если р=(р, ...,/>„) - конечная, а Т= {/.}", - бесконечная последовательности элементов

из 0, торТ= 0, h, ...)

Лемма 2.10.1. Если последовательность Т имеет бесконечную глубину, го для любой конечной последовательности р и любого к последовательностьрсо к (Т) также имеет бесконечную глубину.

Доказательство. Поскольку Т имеет бесконечную глубину, у нее бесконечное множество попарно различных окончаний. При переходе от Т к ы к {Т) их число уменьшается не более, чем на к , все равно оставаясь бесконечным. При переходе от со к (Т) к ры к {Т) число попарно различных окончаний, очевидно, не уменьшается.

Лемма 2.10.2. Пусть последовательность Т представима в виде Т=ррр где р - некоторая непустая конечная последовательность. Тогда Т имеет конечную глубину.

Доказательство. Пусть р имеет вид р=(р, Тогда элементы последовательности Т связаны соотношениями t i+nk = t, для всех целых / > 1 и к > 0. Возьмем произвольноеу-окончание,у > п. Число j единственным образом представимо в виде j = i + п к, где /е{1, ...,«}, А">0. Нетрудно показать, что a>(T) = (о,{Т) для любого целого m > 0 выполняется = t i+ „ k+m =

С учетом произвольности j мы показали, что у последовательности Т не более п попарно различных окончаний, т. е. ее глубина конечна.

Лемма 2.10.3. Пусть для последовательности Т выполняется тождество Т = р Т, где р - некоторая непустая конечная последовательность. Тогда Т имеет конечную глубину.

Доказательство. Пусть р = (/? ь ...,р„). Имеем:

Т=р Т=рр Т=ррр Т=рррр Т= ... . Таким образом, для любого целого к> 0 фрагмент (/„*+, ..., /„*+„) совпадает с (р ь Поэтому

Т представима в виде Т = ррр... и, согласно лемме 2.10.2, имеет конечную глубину.

Лемма 2.10.4, Пусть для последовательности Т выполняется тождество р Т = q Т, где р и q - некоторые нетождественные непустые конечные последовательности. Тогда Т имеет конечную глубину.

Доказательство. Пусть р = (/;, . и q = (q b ..., q k). Если п = к, го, очевидно, тождество pT=q Т не может выполняться. Поэтому рассмотрим случай пФк. Пусть для определенности п > к. Тогда р = (q u ..., q k ,p k+ , ...,р„), и из условияpT=q Т следует, что d Т= Т, где d = (j ) k+ 1 , ...,р п). Применяя лемму 2.10.3, получаем, что глубина последовательности Т конечна.

Доказательство утверждения 2.ЮЛ. Пусть имеется произвольная структура информированности первого агента бесконечной глубины - для единообразия с леммами 2.10Л-2Л0.4 будем обозначать ее не /, а Т= (t, t 2 , . По условию утверждения, существует по крайней мере одна пара функций!//( )), удовлетворяющая соотношениям (4); зафиксируем любую из таких пар. Положим значение функции ф ( ) на последовательности Т равным

X". ф(Т) = х (здесь и далее для «заново определяемых» функций будем применять обозначения ф ( ) и ф ( )) Подставляя Т в качестве аргумента функции ф ( ) в соотношения (4), получаем, что значение ф (Т) = х связано (в силу (4)) со значениями функции ф ( ) на последовательности (0 (Т), а также на всех таких последовательностях 7”,

ДЛЯ КОТОРЫХ СО(Т’)= Т.

Выберем значения функции ф ( ) на этих последовательностях таким образом, чтобы выполнялись условия (4):

где t е Q; из (5) вытекает, что эго можно сделать. Если множество BR"(t,x) или BR 2 {t,x) содержит более одного элемента, возьмем любой из них.

р(* 3 ,/ 4 ,...) € BR 2 "(t 2 , а, подставляя (t , t 2 , t 2 , ...), выберем

Продолжая подставлять уже полученные значения в соотношения (4), можно последовательно определить значения функции ф ( ) на всех последовательностях вида

где (т + к) - нечетное, и значения функции ф (?) на последовательностях вида (6) с четным (т + к). Далее будем считать, что в (6) при т> 1 выполняется Ф t m ., - тогда представление в виде (6) является

однозначным.

Алгоритм определения значения функций на последовательностях вида (6) состоит из двух этапов. На первом этапе полагаем ф (Т)=х и определяем значения соответствующих функций на последовательностях со,„(Г) = (t„„ t m+ 1, ...), m > 1 (т. e. при k= 0), попеременно применяя отображения ДД, 1 и 5/?, 1 .

На втором этапе для определения значения соответствующих функций на последовательностях (6) при к > 1 исходим из определенного на первом этапе значения на последовательности (t„„ t„,+ 1, ...), применяя попеременно отображения BR и BR 2 .

Согласно лемме 1 все последовательности вида (6) имеют бесконечную глубину. Согласно лемме 4 все они попарно различны (если бы какие-либо две последовательности вида (6) совпадали, эго противоречило бы бесконечности глубины). Поэтому, определяя значения функций ф ( ) и ф ( ), мы не рискуем присвоить одному и тому же аргументу разные значения функции.

Таким образом, мы определили значения функций ф ( ) и ф ( ) на последовательностях вида (6) таким образом, что эти функции по- прежнему удовлетворяют условиям (4) (т. е. являются точечным равновесием Байеса-Нэша) и при этом ф (Т) = %. Утверждение 2. К). 1 доказано.

Итак, выше введено понятие точечного равновесия Байеса- Нэша. Доказано, что при выполнении дополнительных условий (5) любое допустимое действие агента, имеющего структуру информированности бесконечной глубины, является равновесным. (Все рассмотрения проводились для игры с двумя участниками, однако можно выдвинуть гипотезу о том, что полученный результат допускает обобщение на случай игры с произвольным числом участников.) Эго обстоятельство, по-видимому, свидетельствует о нецелесообразности рассмотрения структур бесконечной глубины как в терминах информационного равновесия, так и в терминах равновесия Байеса-Нэша.

В более общем плане можно отметить, что доказанное утверждение является аргументом (причем не единственным, см., например, разделы 2.6 и 3.2) в пользу неизбежной ограниченности ранга информационной рефлексии принимающих решение субъектов.