15.01.2024

Граф рефлексивной игры. Игры на рефлексию Нормирование действий игроков, ауторефлексия и рефлексивное состояние


Новиков Д.А., Чхартишвили А.Г.
Рефлексивные игры
М.: СИНТЕГ, 2003.- 160 с.

Материалы предоставлены сайтом "Теория управления организационными системами "

Аннотация

Монография посвящена обсуждению современных подходов к математическому моделированию рефлексии. Авторы вводят в рассмотрение новый класс теоретико-игровых моделей - рефлексивные игры, описывающие взаимодействие субъектов (агентов), принимающих решения на основании иерархии представлений о существенных параметрах, представлений о представлениях и т.д.

Анализ поведения фантомных агентов, существующих в представлениях других реальных или фантомных агентов, и свойств информационной структуры, отражающей взаимную информированность реальных и фантомных агентов, позволяет предложить в качестве решения рефлексивной игры информационное равновесие, которое является обобщением ряда известных концепций равновесия в некооперативных играх.

Рефлексивные игры дают возможность:

Моделировать поведение рефлексирующих субъектов;
- исследовать зависимость выигрышей агентов от рангов их рефлексии;
- ставить и решать задачи рефлексивного управления;
- единообразно описывать многие явления, связанные с рефлексией: скрытое управление, информационное управление через СМИ, рефлексию в психологии, художественных произведениях и др.

Книга адресована специалистам в области математического моделирования и управления социально-экономическими системами, а также студентам вузов и аспирантам.

ВВЕДЕНИЕ
ГЛАВА 1. Информация в принятии решений
1.1. Индивидуальное принятие решений: модель рационального поведения
1.2. Интерактивное принятие решений: игры и равновесия
1.3. Общие подходы к описанию информированности
ГЛАВА 2. Стратегическая рефлексия
2.1. Стратегическая рефлексия в играх двух лиц
2.2. Рефлексия в биматричных играх
2.3. Ограниченность ранга рефлексии
ГЛАВА 3. Информационная рефлексия
3.1. Информационная рефлексия в играх двух лиц
3.2. Информационная структура игры
3.3. Информационное равновесие
3.4. Граф рефлексивной игры
3.5. Регулярные структуры информированности
3.6. Ранг рефлексии и информационное равновесие
3.7. Рефлексивное управление
ГЛАВА 4. Прикладные модели рефлексивных игр
4.1. Скрытое управление
4.2. СМИ и информационное управление
4.3. Рефлексия в психологии
4.3.1. Психология шахматного творчества
4.3.2. Трансакционный анализ
4.3.3. Окно Джохари
4.3.4. Модель этического выбора
4.4. Рефлексия в художественных произведениях
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА

Электронная версия книги: [Скачать, PDF, 29 стр., 250 Кбайт ].

Для просмотра книги в формате PDF требуется программа Adobe Acrobat Reader, новую версию которой можно бесплатно скачать с сайта компании Adobe.

Если структура информированности имеет конечную сложность, то можно построить граф рефлексивной игры, наглядно показывающий взаимосвязь между действиями агентов (как реальных, гак и фантомных), участвующих в равновесии.

Вершинами этого ориентированного графа являются действия г е ?+, отвечающие попарно нетождественным структурам информированное™ /., или компоненты структуры информированности в„ или просто номер г реального или фантомного агента, г е Z+.

Между вершинами проведены дуги по следующему правилу: к каждой вершине х ы проведены дуги от (п - 1) вершин, отвечающих структурам I mp j е N {/} Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.

Подчеркнем, что граф рефлексивной игры соответствует системе уравнений (2.3.1) (то есть определению информационного равновесия), в то время как решения ее может и не существовать.

Итак, граф G, рефлексивной игры Г, (см. определение рефлексивной игры в предыдущем разделе), структура информированности которой имеет конечную сложность, определяется следующим образом:

  • - вершины графа G t соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетождественным структурам информированности;
  • - дуги графа G t отражают взаимную информированность агентов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом.

Если в вершинах графа G/ изображать представления соответствующего агента о состоянии природы, то рефлексивная игра Г, с конечной структурой информированности / может быть задана кортежем Г, = {N, (А)), е N,f{ ), e ,v, G/}, где N - множество реальных агентов, X, - множество допустимых действий z"-го агента, f{-) 0 х X -> 9?" - его целевая функция, /" е N, G,- граф рефлексивной игры.

Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа G/, а не дерева информационной структуры.

Рассмотрим несколько примеров нахождения информационного равновесия.

Примеры 2.4.1-2.4.3. В этих примерах участвуют три агента с целевыми функциями следующего вида:

гдеXi> 0, / € N= (1, 2, 3}; в е 0 = {1, 2}.

Для краткости будем называть агента, считающего, что спрос низкий (0= 1), пессимистом, а считающего, что спрос высокий (0 = 2) - оптимистом. Таким образом, в примерах 2.4.1-2.4.3 ситуации различаются лишь вследствие различных структур информированности.

Пример 2.4.1. Пусть первые два агента оптимисты, а третий - пессимист, причем все трое одинаково информированы. Тогда, в соответствии с утверждением 2.2.5, для любого а е I выполняются тождества / ст] = / ь / ст2 = h, Дз = h-

В соответствии со свойством 2 определения информационного равновесия, х*.

Видно, что любая структура информированности тождественна одной из трех, образующих базис: {/ ь / 2 , Д}. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 8.

Рис. 8.


Таким образом, действия агентов в ситуации информационного равновесия будут следующими: X! = х 2 =1/2, =0.*

Пример 2.4.2. Пусть первые два агента оптимисты, а третий - пессимист, который считает всех грех агентов одинаково информированными пессимистами. Первые два агента одинаково информированы, причем оба они адекватно информированы о третьем агенте.

Имеем: I x ~ I 2 , I > h, h > h, 1 I 2 h ? Граф рефлексивной игры изображен на Рис. 9.

Рис. 9.

Эти условия можно записать в виде следующих тождеств, имеющих место для любого ае I (воспользуемся соответствующими определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

12а = ha, 1Ъа = ha, ha = ha, hla = ha, ha = h, ha2 = hi, hal = h-

Аналогичные соотношения выполняются для равновесных действий х„ . Левые части этих тождеств показывают, что любая структура 1 п при |сг|>2 тождественна некоторой структуре /„ |г|

Таким образом, сложность данной структуры информированности равна пяти, а глубина равна двум.

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):


Таким образом, действия реальных агентов в ситуации информационного равновесия будут следующими: Х) =х 2 =9/20, х 3 * = 1/5.

Пример 2.4,3. Пусть все трое агентов оптимисты, первый и второй взаимно информированы, второй и третий также взаимно информированы. По мнению первого агента, третий считает всех троих одинаково информированными пессимистами; также и первый агент, по мнению третьего, считает всех троих одинаково информированными пессимистами.

Имеем: Д х Д, / 2 >

Эти условия можно записать в виде следующих тождеств, имеющих место для любого а е I (воспользуемся соответствующими определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):

Аналогичные соотношения выполняются для равновесных действий х п.

Левые части этих тождеств показывают, что любая структура 1 П при |oj > 3 тождественна некоторой структуре /„ |т| 1, А, /3, /зь /13, /вь /132? hn, /зв-

Таким образом, базис образуют следующие попарно различные структуры: {/ ь />, /3, /зь /в, /lb}- Сложность данной структуры информированности равна шести, а глубина равна трем. Граф соответствующей рефлексивной игры изображен на Рис. 10.

Рис. 10.

Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):

Таким образом, действия реальных агентов в ситуации информационного равновесия будут следующими: х, = х 3 =17/35, х 2 * = 12/35.

Завершив описание графа рефлексивной игры, продолжим исследование свойств информационного равновесия.

Чтобы пользоваться предварительным просмотром создайте себе аккаунт (учетную запись) Google и войдите в него: https://accounts.google.com


Предварительный просмотр:

Итоговый отчёт о проделанной работе по реализации плана «Рефлексивный круг» в рамках социализации

Рефлексия – размышление человека, направленное на анализ самого себя (самоанализ) – собственных состояний, своих поступков и прошедших событий. (ФОТОГРАФИЯ С КОСМОСА)

«Рефлексивный круг» – это технология, которая позволяет развивать речь дошкольников, мысли детей. Круг способствует совершенствованию речи, как средства общения, помогает детям высказывать предположения, делать простейшие выводы.

На ежедневных рефлексивных кругах в группах дошкольного возраста, воспитатель задает вопросы, на которые дети активно отвечают.

(ФОТО)

За время проведения ежедневных рефлексивных кругов в течение года, дети научились внимательно слушать воспитателя и своих сверстников, не перебивать друг друга.

(ФОТО)

Дети научились пользоваться правилами, которые изображены на пиктограммах и находятся в каждой группе на уровне глаз детей.

(ФОТОГРАФИИ пиктограмм)

Начиная с младшей группы «рефлексивный круг» проводится каждый день перед завтраком со всеми детьми, присутствующими в группе. Целью этого круга обсуждение планов на день или каких-либо проблем группы. Если того требуют обстоятельства, например, в группе произошло какое-то событие, то «рефлексивный круг» может проводиться ещё раз сразу после происшествия.

Круг проводится в одном и том же месте, для того чтобы в будущем дети привыкли обсуждать свои проблемы в кругу без присутствия воспитателя, в данном случае круги проводились в группе на ковре. Для эффективности обсуждения во время кругов используем свечу, которая ставится в центр круга, и любой предмет, которую дети передают друг другу во время ответов на вопросы, что помогает детям концентрироваться на выслушивание ответов и не перебивать друг друга.

Так же рефлексивные круги проводятся после клубных часов. На этих кругах можно узнать и понять, что детям понравилось, и что не понравилось во время проведения клубного часа.

(ФОТО С КОСМОСА И ФОТО КРУГОВ)

Помимо запланированных, темы «Кругов рефлексии» определялись воспитателем по обстоятельствам, например, если в группе произошло какое-то событие.

В итоге к концу учебного года многие дети овладели навыками связной речи, умение излагать свои мысли. Сформированы навыки слушать друг друга. Большинство детей желает выразить свои чувства и переживания.

Сентябрь

Ситуация месяца «Мой детский сад»

п/п

Участники

Дата

проведения

4.09.2017

Кого мы называем друзьями? О каком друге ты мечтаешь?

18.09.2017

Какого цвета дружба?

Средние группы

11.09.2017

С кем я хотел бы дружить в группе? Как мы делим игрушки?

25.09.2017

Кто такой воспитатель?

Октябрь

Ситуация месяца «Моя Родина»

Старшие и подготовительные группы

4.10.2017

Насколько хорошо я знаю свой город? За что я люблю свой город?

18.10.2017

31.10.2017

Детская площадка в моем городе. Чем заняться в выходные? Любимое место в Москве моих родителей. И почему?

Средние группы

11.10.2017

А у нас во дворе? Детская площадка в моем городе.

25.10.2017

Куда я хожу с родителями?

Ноябрь

Ситуация месяца «Я – житель Земного шара»

п/п

Участники

Дата

Проведения

Старшие и подготовительные группы

8.11.2017

Какие страны я знаю? В какой стране хотел бы побывать?

22.11.2017

Как себя вести при встрече с иностранцем?

Средние группы

15.11.2017

Страна, где я живу.

29.11.2017

Мои любимые песни, игры, мультфильмы. Сказочная страна.

2017-18 уч. года)

Ситуация месяца «Новый год. Волшебные подарки»

Старшие и подготовительные группы

6.12.2017

Как и чем можно украсить елочку в Новый год? Моё новогоднее желание. Что такое чудо?

20.12.2017

Как нужно вести себя на утренниках? Как организовать свой досуг?

10.01.2018

Как помочь птицам зимой?

Младшие и

средние группы

6.12.2017

Как и чем можно украсить елочку в Новый год?

Моё новогоднее желание.

20.12.2017

Как нужно вести себя на утренниках?

2018 уч. года)

Ситуация месяца «Мальчики и девочки»

п/п

Участники

Дата

проведения

Старшие и подготовительные группы

24.01.2018

Кто такая девочка? Кто такой мальчик? Различие признаков.

7.02.2018

Что влияет на наше настроение?

Средние группы

31.01.2018

Зачем мы питаемся?

14.01.2018

Какие добрые поступки можно сделать по отношению к мальчикам?

Какие добрые поступки можно сделать по отношению к девочкам?

2018 уч. года)

Ситуация месяца «Моя семья. Мои корни»

Старшие и подготовительные группы

21.02.2018

Что такое семья?

28.02.2018

За что я люблю свою семью?

7.03.2018

Кем работают родители?

Средние группы

28.02.2018

Что значит дружная семья?

14.03.2018

Кто живёт с тобой дома?

2018 уч. года)

Ситуация месяца «Весна красна»

п/п

Участники

Дата

проведения

Старшие и подготовительные группы

21.03.2018

Какие происходят изменения в природе весной?

4.04.2018

Что происходит весной с деревьями?

Средние группы

Старшие и подготовительные группы

10.04.2018

Что мы знаем о космосе?

18.04.2018

Что мы знаем о планете Земля?

Средние группы

11.04.2018

Кто первый космонавт?

25.04.2018

Планета, на которой мы живём. 8.05.2018

Великий праздник «День Победы».Какая наша Родина – Россия?

23.05.2018

Какая наша Родина – Россия?

Средние группы

2.05.2018

Что ты знаешь о празднике «Великой победы»?

16.05.2018

Кто мы жители страны России?

Итог «Рефлексивных кругов» за год:

Дети умеют вежливо общаться друг с другом и с окружающими взрослыми. Умеют вести диалог, при этом используют различные средства выразительности. Дети внимательно слушают друг друга и понимают.


ПОДВЕДЕНИЕ ИТОГОВ ДЕЛА (РЕФЛЕКСИЯ)

«ДЕРЕВО НАСТРОЕНИЙ»

На листе ватмана рисуется дерево – каждая веточка – это отдельный день. Вечером ребенок на сегодняшней веточке может нарисовать листочек одного из трех цветов. зеленый означает, что настроение у ребенка отличное, желтый – хорошее, красный – так себе. К концу смены у вас появится полная картина того, как она прошла для ваших детей.

«С НЕБА ЗВЕЗДОЧКА УПАЛА»

Детям говорится о том, что, когда падают звезды, можно загадывать желание и многие люди, вувидев падающую звезду, загадывают самое заветное желание и оно обязательно сбывается. Ребята пишут на своей звезде (вырезанной из картона), чего они ждут от этой смены. Вожатый собирает все звезды и вешает их на стену. В конце смены их снимают, читают пожелания и вместе обсуждают, что сбылось, а что нет

«ЧЕМОДАНЧИК В ДОРОГУ»

В волшебный чемоданчик можно положить что угодно и оно сохранится в неизменном виде. Каждый выбирает три вещи, которые он хотел бы унести с занятия: хорошее настроение, друга, стул, на котором он сидит.

«ЗАКОНЧИТЕ ПРЕДЛОЖЕНИЕ»

Сегодняшний день - это:

Мое настроение сегодня:

Я хотел бы, чтобы завтра:

Опираясь на высказывания детей, вожатый подводит итог дня.

Попрощаемся как на Адаманских островах в Тихом океане.

Положите правую ладошку под ладошку соседа справа; а левую - на ладошку соседа слева. И с самыми добрыми и светлыми пожеланиями, с самой положительной энергией дуем на ладошку соседа справа.

Конверт откровений”

Вожатый заранее заготавливает конверт с большим количеством вопросов. Желательно, чтобы вопросы носили нравственно-этический характер, типа:

что ты больше всего ценишь в людях?

какая твоя самая большая цель в жизни?

какие черты характера человека тебе особенно неприятны?

на кого из известных героев прошлого (фильма, книги) ты хотел бы быть похожим и почему? и т.д.

"По одежке встречают …"

Этот этап работы вызывает интерес и легкое волнение у членов группы. В процессе поиска своего «портрета» им приходится прочитать не один, а несколько листочков, «поспорить» с кем-то из претендентов за одну и ту же характеристику, суметь отстоять свое право на нее. При обсуждении ведущий предлагает ответить на несколько вопросов:

Удовлетворены ли вы тем, что написано на полученном листочке?

Что вызвало удивление, произошли ли «открытия»?

Что вызвало наибольший интерес в процессе работы?

Какие трудности испытывали при выполнении упражнения?

Гороскоп

2-3 день смены.

Дети распределяются по группам - знакам зодиака. Перед высказыванием - краткая характеристика знака. Необычная характеристика детей, форма запоминания личности через выделение необычных качеств. Можно сравнивать по сезонам года, цвету глаз и т.д.

Уровень отряда -- низкий.

Ситуативный

(Электрический стул)

Один участник находится спиной к аудитории, все пишут записки с краткой характеристикой этого человека, которые потом зачитываются ведущим (корректирующим текст в случае его некорректности по отношению к человеку).

Дает возможность дать оценку поведения того или иного ребенка членам отряда без амбиций, обид, оскорблений его личного достоинства.

Свеча - прожитый день.

Ребята садятся в круг и, передавая свечку друг другу, рассказывают по очереди, как прошел для них день и оценка его.

Свеча - желание.

Передавая свечку по кругу, к обычной оценке дня можно добавить свои пожелания на завтра. Можно начать словами: "Я бы хотела, чтобы завтра…"

Паутинка.

Все садятся в круг. Вожатый берет клубок ниток, наматывает нитку на свой палец и передает этот клубок любому ребенку из круга ("Я хотел бы передать этот клубок Кате, потому что…"). Далее второй участник наматывает свою ниточку на палец, и передает клубок следующему, объясняя свой выбор. И так далее, пока все не будут связаны одной ниточкой. Можно увидеть те связи, которые возникли между ребятами в отряде. Каждый может отрезать, намотанную на палец ниточку на память.

«Пять минут откровения»

Весь отряд в течение всего дня складывает в коробку в виде почтового ящика записки с вопросами, которые они хотели бы задать своим вожатым на итоговом «огоньке». На «огоньке» на эти вопросы отвечают вожатые.

«Записки»

Изготавливаются конверты и маленькие записочки. Количество конвертов равно количеству детей в отряде. На записках каждый ребёнок пишет пожелания, слова благодарности, впечатления от каждого человека из отряда. Эти записки вкладываются в конверты, которые творчески оформлены и подписаны. Затем эти конверты в творческой форме вручаются их владельцам. Но только на следующий день разрешается открыть конверты и прочитать записки.

Наряду с рефлексивными играми возможным методом теоретико-игрового моделирования в условиях неполной информированности являются байесовы игры, предложенные в конце 60-х годов XX в. Дж. Харшаньи . В байесовых играх вся частная (т. е. не являющаяся общим знанием) информация, имеющаяся у агента на момент выбора им своего действия, называется типом агента. При этом каждый агент, зная свой тип, имеет и предположения о типах остальных агентов (в виде вероятностного распределения). Формально байесова игра описывается следующим набором:

  • - множеством N агентов;
  • - множествами /?, возможных типов агентов, где тип /-го агента

Множеством X’ = J - [ X х допустимых векторов действий аген-

  • -набором целевых функций /: R’x X ’-> 9? 1 (целевая функция агента зависит в общем случае от типов и действий всех агентов);
  • - представлениями F,(-|r,) е Д(/?_,), /" е N, агентов (здесь через /?_, обозначено множество всевозможных наборов типов всех агентов, кроме /-го, R.j = П R t , а через Д(/?_,) обозначено множесг-

во всевозможных вероятностных распределений на /?_,). Решением байесовой игры является равновесие Байеса-Нэша, определяемое как набор стратегий агентов вида х *: R, -> X h i е N,

которые максимизируют математические ожидания соответствующих целевых функций:


где jcобозначает набор стратегий всех агентов, кроме /-го. Подчеркнем, что в байесовой игре стратегией агента является не действие, а функция зависимости действия агента от его типа.

Модель Дж. Харшаньи можно интерпретировать различным образом (см. ). В соответствии с одной интерпретацией все агенты знают априорное распределение типов F{r) е Д(R ’) и, узнав собственный тип, вычисляют из него по формуле Байеса условное распределение Fj(r.i | г,). В этом случае представления агентов {F,(-|-)}, sW называются согласованными (и, в частности, являются общим знанием - каждый агент может их вычислить, знает, что эго могут сделать остальные и т. д.).

Другая интерпретация состоит в следующем. Пусть существует некоторый набор потенциальных участников игры всевозможных типов. Каждый такой «потенциальный» агент выбирает свою стратегию в зависимости от своего типа, после чего случайным образом выбирается п «актуальных» участников игры. В этом случае представления агентов, вообще говоря, не обязательно согласованы (хотя и являются общим знанием). Отметим, что в эта интерпретация названа игрой Зельтена (Р. Зельген - лауреат Нобелевской премии по экономике 1994 года, вместе с Дж. Нэшем и Дж. Харшаньи).

Теперь рассмотрим ситуацию, когда условные распределения не обязательно являются общим знанием. Удобно описывать ее следующим образом. Пусть выигрыши агентов зависят от их действий и от некоторого параметра в е 0 («состояния природы», которое может интерпретироваться и как набор типов агентов), значение которого не является общим знанием, т. е. целевая функция /-го агента имеет вид f i {0,x x ,...,x n): 0 х X’ -» "Л 1 , /" е N. Как было отмечено во второй главе данной работы, выбору агентом своей стратегии логически предшествует информационная рефлексия - размышления агента о том, что каждый агент знает (предполагает) о параметре 0, а также о предположениях других агентов и пр. Тем самым, мы приходим к понятию структуры информированности агента, отражающей его информированность о неизвестном параметре, о представлениях других агентов и т. д.

В в рамках вероятностной информированности (представления агентов включают в себя следующие компоненты: вероятностное распределение на множестве состояний природы; вероятностное распределение на множестве состояний природы и распределениях на множестве состояний природы, характеризующих представления остальных агентов, и т. д.) было построено универсальное пространство возможных взаимных представлений (universal beliefs space). При этом игра формально сводится к некоей «универсальной» байесовой игре, в которой типом агента является вся его структура информированности. Однако предложенная в конструкция настолько громоздка, что найти решение «универсальной» байесовой игры в общем случае, по-видимому, невозможно.

В данном разделе мы ограничимся рассмотрением игр двух лиц, при этом представления агентов задаются точечной структурой информированности (у агентов имеются вполне определенные представления о значении неопределенного параметра; о том, каковы представления (также вполне определенные) оппонента, и т. д.) С учетом этих упрощений нахождение равновесия Байеса-Нэша сводится к решению системы двух соотношений, определяющих две функции, каждая из которых зависит от счетного числа переменных (см. ниже).

Итак, пусть в игре участвуют два агента с целевыми функциями

причем функции f и множества Х ь 0 являются общим знанием. Первый агент имеет следующие представления: неопределенный параметр равен 0 е 0; второй агент считает, что неопределенный параметр равен в ]2 е 0; второй агент считает, что первый агент считает, что неопределенный параметр равен в 2 е 0 и т. д. Таким образом, точечная структура информированности первого агента /, задается бесконечной последовательностью элементов множества 0; пусть, аналогично, и у второго агента имеется точечная структура информированности 1 2:

Посмотрим теперь на рефлексивную игру (2)-(3) с «байесовой» точки зрения . Типом агента в данном случае является его структура информированности /, /=1, 2. Для нахождения равновесия Байеса-Нэша необходимо найти равновесные действия агентов всевозможных типов, а не только некоторых фиксированных типов (3).

Легко видеть, какими будут в данном случае распределения F,(-|-) из определения равновесия (1). Если, например, тип первого агента 1={6, 0 !2 , 0ш, ...), то распределение Fi(-|/i) приписывает вероятность 1 типу оппонента / 2 =(0 | 2 , 012ь 0Ш2, ) и вероятность О остальным типам. Соответственно, если тип второго агента ^2 = (02> $2ь Фиг* )> то распределение F 2 (-|/ 2) приписывает вероятность 1 типу оппонента 1=(в 2 , 0 212 , 02:2и ) и вероятность 0 остальным типам.

Для упрощения записи будем использовать в дальнейшем следующие обозначения:

Введем также обозначения

В этих обозначениях точечное равновесие Байеса-Нэша (1) записывается как пара функций {(pi-), i//(-)), удовлетворяющих условиям

Заметим, что в рамках точечной структуры информированности 1-й агент уверен, что значение неопределенного параметра равно 0, (вне зависимости от представлений оппонента).

Таким образом, для нахождения равновесия необходимо решить систему функциональных уравнений (4) для определения функций (р(-) и!//( ), каждая из которых зависит от счетного числа переменных.

Возможные структуры информированности могут иметь конечную либо бесконечную глубину. Покажем, что применение концепции равновесия Байеса-Нэша к агентам со структурой информированности бесконечной глубины дает парадоксальный результат - для них равновесным является любое допустимое действие.

Определим понятие конечности глубины структуры информированности применительно к случаю игры с двумя участниками, когда структура информированности каждого из них является бесконечной последовательностью элементов из 0.

Пусть даны последовательность Т= {t j } " =[ элементов из 0 и целое неотрицательное число к. Последовательность (о к {Т)= {t t } /=i+1

будем называть к-окончанием последовательности Т.

Будем говорить, что последовательность Т имеет бесконечную глубину, если для любого п найдется к>п такое, что последовательность со к (Т) не совпадает (имеется в виду обычное поэлементное совпадение) ни с одной из последовательностей набора а>и(Г)=Т, (0 (Т),..., (о п (Т). В противном случае последовательность Т имеет конечную глубину.

Иначе говоря, последовательность конечной глубины имеет конечное число попарно различных окончаний, в то время как у последовательности бесконечной глубины их бесконечно много. Например, последовательность (1, 2, 3, 4, 5, ...) имеет бесконечную глубину, а последовательность (1, 2, 3, 2, 3, 2, 3, ...) - конечную.

Рассмотрим игру (2), в которой целевые функции f, f 2 и множества Х, Х 2 , 0 обладают следующим свойством:

(5) для любых Л"| е Х, х 2 е Х 2 , в е 0 множества

Условия (5) означают, что для любого в е © и любого действия Xi е Х у второго агента существует хотя бы один наилучший ответ и, в свою очередь, само действие Х является наилучшим ответом на какое-то действие второго агента; аналогично и любое действие

Х 2 G Х 2 .

Оказывается, что при выполнении условий (5) в игре (2) любое действие агента со структурой информированности бесконечной глубины является равновесным (г. е. является компонентой некоторого равновесия (4)). Эго справедливо для обоих агентов; для определенности сформулируем и докажем утверждение для первого.

Утверждение 2.10.1 .Пусть в игре (2), в которой выполнены условия (5), существует хотя бы одно точечное равновесие Байеса- Нэша (4). Тогда для любой структуры информированности бесконечной глубины 1 и любого % е Х существует равновесие (*,*( )> х*(-)), в котором х*(/,) =х-

Идея доказательства состоит в конструктивном построении соответствующего равновесия. Зафиксируем произвольное равновесие (1. В силу условий (4) значение функции ф ( ) принимала на структуре 1 значение х-

Доказательству утверждения 2.10.1 предпошлем четыре леммы, для формулировки которых введем обозначение: если р=(р, ...,/>„) - конечная, а Т= {/.}", - бесконечная последовательности элементов

из 0, торТ= 0, h, ...)

Лемма 2.10.1. Если последовательность Т имеет бесконечную глубину, го для любой конечной последовательности р и любого к последовательностьрсо к (Т) также имеет бесконечную глубину.

Доказательство. Поскольку Т имеет бесконечную глубину, у нее бесконечное множество попарно различных окончаний. При переходе от Т к ы к {Т) их число уменьшается не более, чем на к , все равно оставаясь бесконечным. При переходе от со к (Т) к ры к {Т) число попарно различных окончаний, очевидно, не уменьшается.

Лемма 2.10.2. Пусть последовательность Т представима в виде Т=ррр где р - некоторая непустая конечная последовательность. Тогда Т имеет конечную глубину.

Доказательство. Пусть р имеет вид р=(р, Тогда элементы последовательности Т связаны соотношениями t i+nk = t, для всех целых / > 1 и к > 0. Возьмем произвольноеу-окончание,у > п. Число j единственным образом представимо в виде j = i + п к, где /е{1, ...,«}, А">0. Нетрудно показать, что a>(T) = (о,{Т) для любого целого m > 0 выполняется = t i+ „ k+m =

С учетом произвольности j мы показали, что у последовательности Т не более п попарно различных окончаний, т. е. ее глубина конечна.

Лемма 2.10.3. Пусть для последовательности Т выполняется тождество Т = р Т, где р - некоторая непустая конечная последовательность. Тогда Т имеет конечную глубину.

Доказательство. Пусть р = (/? ь ...,р„). Имеем:

Т=р Т=рр Т=ррр Т=рррр Т= ... . Таким образом, для любого целого к> 0 фрагмент (/„*+, ..., /„*+„) совпадает с (р ь Поэтому

Т представима в виде Т = ррр... и, согласно лемме 2.10.2, имеет конечную глубину.

Лемма 2.10.4, Пусть для последовательности Т выполняется тождество р Т = q Т, где р и q - некоторые нетождественные непустые конечные последовательности. Тогда Т имеет конечную глубину.

Доказательство. Пусть р = (/;, . и q = (q b ..., q k). Если п = к, го, очевидно, тождество pT=q Т не может выполняться. Поэтому рассмотрим случай пФк. Пусть для определенности п > к. Тогда р = (q u ..., q k ,p k+ , ...,р„), и из условияpT=q Т следует, что d Т= Т, где d = (j ) k+ 1 , ...,р п). Применяя лемму 2.10.3, получаем, что глубина последовательности Т конечна.

Доказательство утверждения 2.ЮЛ. Пусть имеется произвольная структура информированности первого агента бесконечной глубины - для единообразия с леммами 2.10Л-2Л0.4 будем обозначать ее не /, а Т= (t, t 2 , . По условию утверждения, существует по крайней мере одна пара функций!//( )), удовлетворяющая соотношениям (4); зафиксируем любую из таких пар. Положим значение функции ф ( ) на последовательности Т равным

X". ф(Т) = х (здесь и далее для «заново определяемых» функций будем применять обозначения ф ( ) и ф ( )) Подставляя Т в качестве аргумента функции ф ( ) в соотношения (4), получаем, что значение ф (Т) = х связано (в силу (4)) со значениями функции ф ( ) на последовательности (0 (Т), а также на всех таких последовательностях 7”,

ДЛЯ КОТОРЫХ СО(Т’)= Т.

Выберем значения функции ф ( ) на этих последовательностях таким образом, чтобы выполнялись условия (4):

где t е Q; из (5) вытекает, что эго можно сделать. Если множество BR"(t,x) или BR 2 {t,x) содержит более одного элемента, возьмем любой из них.

р(* 3 ,/ 4 ,...) € BR 2 "(t 2 , а, подставляя (t , t 2 , t 2 , ...), выберем

Продолжая подставлять уже полученные значения в соотношения (4), можно последовательно определить значения функции ф ( ) на всех последовательностях вида

где (т + к) - нечетное, и значения функции ф (?) на последовательностях вида (6) с четным (т + к). Далее будем считать, что в (6) при т> 1 выполняется Ф t m ., - тогда представление в виде (6) является

однозначным.

Алгоритм определения значения функций на последовательностях вида (6) состоит из двух этапов. На первом этапе полагаем ф (Т)=х и определяем значения соответствующих функций на последовательностях со,„(Г) = (t„„ t m+ 1, ...), m > 1 (т. e. при k= 0), попеременно применяя отображения ДД, 1 и 5/?, 1 .

На втором этапе для определения значения соответствующих функций на последовательностях (6) при к > 1 исходим из определенного на первом этапе значения на последовательности (t„„ t„,+ 1, ...), применяя попеременно отображения BR и BR 2 .

Согласно лемме 1 все последовательности вида (6) имеют бесконечную глубину. Согласно лемме 4 все они попарно различны (если бы какие-либо две последовательности вида (6) совпадали, эго противоречило бы бесконечности глубины). Поэтому, определяя значения функций ф ( ) и ф ( ), мы не рискуем присвоить одному и тому же аргументу разные значения функции.

Таким образом, мы определили значения функций ф ( ) и ф ( ) на последовательностях вида (6) таким образом, что эти функции по- прежнему удовлетворяют условиям (4) (т. е. являются точечным равновесием Байеса-Нэша) и при этом ф (Т) = %. Утверждение 2. К). 1 доказано.

Итак, выше введено понятие точечного равновесия Байеса- Нэша. Доказано, что при выполнении дополнительных условий (5) любое допустимое действие агента, имеющего структуру информированности бесконечной глубины, является равновесным. (Все рассмотрения проводились для игры с двумя участниками, однако можно выдвинуть гипотезу о том, что полученный результат допускает обобщение на случай игры с произвольным числом участников.) Эго обстоятельство, по-видимому, свидетельствует о нецелесообразности рассмотрения структур бесконечной глубины как в терминах информационного равновесия, так и в терминах равновесия Байеса-Нэша.

В более общем плане можно отметить, что доказанное утверждение является аргументом (причем не единственным, см., например, разделы 2.6 и 3.2) в пользу неизбежной ограниченности ранга информационной рефлексии принимающих решение субъектов.


© 2024
arsenmusic.ru - Игры. Гонки. Логические. Стрелялки