Новиков Д.А., Чхартишвили А.Г.
Рефлексивные игры
М.: СИНТЕГ, 2003.- 160 с.
Материалы предоставлены сайтом "Теория управления организационными системами "
Аннотация
Монография посвящена обсуждению современных подходов к математическому моделированию рефлексии. Авторы вводят в рассмотрение новый класс теоретико-игровых моделей - рефлексивные игры, описывающие взаимодействие субъектов (агентов), принимающих решения на основании иерархии представлений о существенных параметрах, представлений о представлениях и т.д.
Анализ поведения фантомных агентов, существующих в представлениях других реальных или фантомных агентов, и свойств информационной структуры, отражающей взаимную информированность реальных и фантомных агентов, позволяет предложить в качестве решения рефлексивной игры информационное равновесие, которое является обобщением ряда известных концепций равновесия в некооперативных играх.
Рефлексивные игры дают возможность:
Моделировать поведение рефлексирующих субъектов;
- исследовать зависимость выигрышей агентов от рангов их рефлексии;
- ставить и решать задачи рефлексивного управления;
- единообразно описывать многие явления, связанные с рефлексией: скрытое управление,
информационное управление через СМИ, рефлексию в психологии, художественных произведениях
и др.
Книга адресована специалистам в области математического моделирования и управления социально-экономическими системами, а также студентам вузов и аспирантам.
ВВЕДЕНИЕ
ГЛАВА 1. Информация в принятии решений
1.1. Индивидуальное принятие решений: модель рационального поведения
1.2. Интерактивное принятие решений: игры и равновесия
1.3. Общие подходы к описанию информированности
ГЛАВА 2. Стратегическая рефлексия
2.1. Стратегическая рефлексия в играх двух лиц
2.2. Рефлексия в биматричных играх
2.3. Ограниченность ранга рефлексии
ГЛАВА 3. Информационная рефлексия
3.1. Информационная рефлексия в играх двух лиц
3.2. Информационная структура игры
3.3. Информационное равновесие
3.4. Граф рефлексивной игры
3.5. Регулярные структуры информированности
3.6. Ранг рефлексии и информационное равновесие
3.7. Рефлексивное управление
ГЛАВА 4. Прикладные модели рефлексивных игр
4.1. Скрытое управление
4.2. СМИ и информационное управление
4.3. Рефлексия в психологии
4.3.1. Психология шахматного творчества
4.3.2. Трансакционный анализ
4.3.3. Окно Джохари
4.3.4. Модель этического выбора
4.4. Рефлексия в художественных произведениях
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
Электронная версия книги: [Скачать, PDF, 29 стр., 250 Кбайт ].
Для просмотра книги в формате PDF требуется программа Adobe Acrobat Reader, новую версию которой можно бесплатно скачать с сайта компании Adobe.
Если структура информированности имеет конечную сложность, то можно построить граф рефлексивной игры, наглядно показывающий взаимосвязь между действиями агентов (как реальных, гак и фантомных), участвующих в равновесии.
Вершинами этого ориентированного графа являются действия г е ?+, отвечающие попарно нетождественным структурам информированное™ /., или компоненты структуры информированности в„ или просто номер г реального или фантомного агента, г е Z+.
Между вершинами проведены дуги по следующему правилу: к каждой вершине х ы проведены дуги от (п - 1) вершин, отвечающих структурам I mp j е N {/} Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.
Подчеркнем, что граф рефлексивной игры соответствует системе уравнений (2.3.1) (то есть определению информационного равновесия), в то время как решения ее может и не существовать.
Итак, граф G, рефлексивной игры Г, (см. определение рефлексивной игры в предыдущем разделе), структура информированности которой имеет конечную сложность, определяется следующим образом:
- - вершины графа G t соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетождественным структурам информированности;
- - дуги графа G t отражают взаимную информированность агентов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом.
Если в вершинах графа G/ изображать представления соответствующего агента о состоянии природы, то рефлексивная игра Г, с конечной структурой информированности / может быть задана кортежем Г, = {N, (А)), е N,f{ ), e ,v, G/}, где N - множество реальных агентов, X, - множество допустимых действий z"-го агента, f{-) 0 х X -> 9?" - его целевая функция, /" е N, G,- граф рефлексивной игры.
Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа G/, а не дерева информационной структуры.
Рассмотрим несколько примеров нахождения информационного равновесия.
Примеры 2.4.1-2.4.3. В этих примерах участвуют три агента с целевыми функциями следующего вида:
гдеXi> 0, / € N= (1, 2, 3}; в е 0 = {1, 2}.
Для краткости будем называть агента, считающего, что спрос низкий (0= 1), пессимистом, а считающего, что спрос высокий (0 = 2) - оптимистом. Таким образом, в примерах 2.4.1-2.4.3 ситуации различаются лишь вследствие различных структур информированности.
Пример 2.4.1. Пусть первые два агента оптимисты, а третий - пессимист, причем все трое одинаково информированы. Тогда, в соответствии с утверждением 2.2.5, для любого а е I выполняются тождества / ст] = / ь / ст2 = h, Дз = h-
В соответствии со свойством 2 определения информационного равновесия, х*.
Видно, что любая структура информированности тождественна одной из трех, образующих базис: {/ ь / 2 , Д}. Поэтому сложность данной структуры информированности равна трем, а глубина равна единице. Граф рефлексивной игры изображен на Рис. 8.
Рис. 8.
Таким образом, действия агентов в ситуации информационного равновесия будут следующими: X! = х 2 =1/2, =0.*
Пример 2.4.2. Пусть первые два агента оптимисты, а третий - пессимист, который считает всех грех агентов одинаково информированными пессимистами. Первые два агента одинаково информированы, причем оба они адекватно информированы о третьем агенте.
Имеем: I x ~ I 2 , I > h, h > h, 1 ~з I 2 ~з h ? Граф рефлексивной игры изображен на Рис. 9.
Рис. 9.
Эти условия можно записать в виде следующих тождеств, имеющих место для любого ае I (воспользуемся соответствующими определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):
12а = ha, 1Ъа = ha, ha = ha, hla = ha, ha = h, ha2 = hi, hal = h-
Аналогичные соотношения выполняются для равновесных действий х„ . Левые части этих тождеств показывают, что любая структура 1 п при |сг|>2 тождественна некоторой структуре /„ |г|
Таким образом, сложность данной структуры информированности равна пяти, а глубина равна двум.
Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):
Таким образом, действия реальных агентов в ситуации информационного равновесия будут следующими: Х) =х 2 =9/20, х 3 * = 1/5.
Пример 2.4,3. Пусть все трое агентов оптимисты, первый и второй взаимно информированы, второй и третий также взаимно информированы. По мнению первого агента, третий считает всех троих одинаково информированными пессимистами; также и первый агент, по мнению третьего, считает всех троих одинаково информированными пессимистами.
Имеем: Д х Д, / 2 >
Эти условия можно записать в виде следующих тождеств, имеющих место для любого а е I (воспользуемся соответствующими определениями и утверждениями 2.2.1, 2.2.2 и 2.2.5):
Аналогичные соотношения выполняются для равновесных действий х п.
Левые части этих тождеств показывают, что любая структура 1 П при |oj > 3 тождественна некоторой структуре /„ |т| 1, А, /3, /зь /13, /вь /132? hn, /зв-
Таким образом, базис образуют следующие попарно различные структуры: {/ ь />, /3, /зь /в, /lb}- Сложность данной структуры информированности равна шести, а глубина равна трем. Граф соответствующей рефлексивной игры изображен на Рис. 10.
Рис. 10.
Для нахождения информационного равновесия надо решить следующую систему уравнений (см. выражение (2.3.1)):
Таким образом, действия реальных агентов в ситуации информационного равновесия будут следующими: х, = х 3 =17/35, х 2 * = 12/35.
Завершив описание графа рефлексивной игры, продолжим исследование свойств информационного равновесия.
Чтобы пользоваться предварительным просмотром создайте себе аккаунт (учетную запись) Google и войдите в него: https://accounts.google.com
Предварительный просмотр:
Итоговый отчёт о проделанной работе по реализации плана «Рефлексивный круг» в рамках социализации
Рефлексия – размышление человека, направленное на анализ самого себя (самоанализ) – собственных состояний, своих поступков и прошедших событий. (ФОТОГРАФИЯ С КОСМОСА)
«Рефлексивный круг» – это технология, которая позволяет развивать речь дошкольников, мысли детей. Круг способствует совершенствованию речи, как средства общения, помогает детям высказывать предположения, делать простейшие выводы.
На ежедневных рефлексивных кругах в группах дошкольного возраста, воспитатель задает вопросы, на которые дети активно отвечают.
(ФОТО)
За время проведения ежедневных рефлексивных кругов в течение года, дети научились внимательно слушать воспитателя и своих сверстников, не перебивать друг друга.
(ФОТО)
Дети научились пользоваться правилами, которые изображены на пиктограммах и находятся в каждой группе на уровне глаз детей.
(ФОТОГРАФИИ пиктограмм)
Начиная с младшей группы «рефлексивный круг» проводится каждый день перед завтраком со всеми детьми, присутствующими в группе. Целью этого круга обсуждение планов на день или каких-либо проблем группы. Если того требуют обстоятельства, например, в группе произошло какое-то событие, то «рефлексивный круг» может проводиться ещё раз сразу после происшествия.
Круг проводится в одном и том же месте, для того чтобы в будущем дети привыкли обсуждать свои проблемы в кругу без присутствия воспитателя, в данном случае круги проводились в группе на ковре. Для эффективности обсуждения во время кругов используем свечу, которая ставится в центр круга, и любой предмет, которую дети передают друг другу во время ответов на вопросы, что помогает детям концентрироваться на выслушивание ответов и не перебивать друг друга.
Так же рефлексивные круги проводятся после клубных часов. На этих кругах можно узнать и понять, что детям понравилось, и что не понравилось во время проведения клубного часа.
(ФОТО С КОСМОСА И ФОТО КРУГОВ)
Помимо запланированных, темы «Кругов рефлексии» определялись воспитателем по обстоятельствам, например, если в группе произошло какое-то событие.
В итоге к концу учебного года многие дети овладели навыками связной речи, умение излагать свои мысли. Сформированы навыки слушать друг друга. Большинство детей желает выразить свои чувства и переживания.
Сентябрь
Ситуация месяца «Мой детский сад»
п/п | Участники | Дата проведения | |
4.09.2017 | Кого мы называем друзьями? О каком друге ты мечтаешь? |
||
18.09.2017 | Какого цвета дружба? |
||
Средние группы | 11.09.2017 | С кем я хотел бы дружить в группе? Как мы делим игрушки? |
|
25.09.2017 | Кто такой воспитатель? |
||
Октябрь Ситуация месяца «Моя Родина» |
|||
Старшие и подготовительные группы | 4.10.2017 | Насколько хорошо я знаю свой город? За что я люблю свой город? |
|
18.10.2017 | |||
31.10.2017 | Детская площадка в моем городе. Чем заняться в выходные? Любимое место в Москве моих родителей. И почему? |
||
Средние группы | 11.10.2017 | А у нас во дворе? Детская площадка в моем городе. |
|
25.10.2017 | Куда я хожу с родителями? |
Ноябрь
Ситуация месяца «Я – житель Земного шара»
п/п | Участники | Дата Проведения | |
Старшие и подготовительные группы | 8.11.2017 | Какие страны я знаю? В какой стране хотел бы побывать? |
|
22.11.2017 | Как себя вести при встрече с иностранцем? |
||
Средние группы | 15.11.2017 | Страна, где я живу. |
|
29.11.2017 | Мои любимые песни, игры, мультфильмы. Сказочная страна. |
2017-18 уч. года)
Ситуация месяца «Новый год. Волшебные подарки»
Старшие и подготовительные группы | 6.12.2017 | Как и чем можно украсить елочку в Новый год? Моё новогоднее желание. Что такое чудо? |
|
20.12.2017 | Как нужно вести себя на утренниках? Как организовать свой досуг? |
||
10.01.2018 | Как помочь птицам зимой? |
||
Младшие и средние группы | 6.12.2017 | Как и чем можно украсить елочку в Новый год? Моё новогоднее желание. |
|
20.12.2017 | Как нужно вести себя на утренниках? |
2018 уч. года)
Ситуация месяца «Мальчики и девочки»
п/п | Участники | Дата проведения | |
Старшие и подготовительные группы | 24.01.2018 | Кто такая девочка? Кто такой мальчик? Различие признаков. |
|
7.02.2018 | Что влияет на наше настроение? |
||
Средние группы | 31.01.2018 | Зачем мы питаемся? |
|
14.01.2018 | Какие добрые поступки можно сделать по отношению к мальчикам? Какие добрые поступки можно сделать по отношению к девочкам? |
||
2018 уч. года) Ситуация месяца «Моя семья. Мои корни» |
|||
Старшие и подготовительные группы | 21.02.2018 | Что такое семья? |
|
28.02.2018 | За что я люблю свою семью? |
||
7.03.2018 | Кем работают родители? |
||
Средние группы | 28.02.2018 | Что значит дружная семья? |
|
14.03.2018 | Кто живёт с тобой дома? |
2018 уч. года)
Ситуация месяца «Весна красна»
п/п | Участники | Дата проведения | ||
Старшие и подготовительные группы | 21.03.2018 | Какие происходят изменения в природе весной? |
||
4.04.2018 | Что происходит весной с деревьями? |
|||
Средние группы | Старшие и подготовительные группы | 10.04.2018 | Что мы знаем о космосе? |
|
18.04.2018 | Что мы знаем о планете Земля? |
|||
Средние группы | 11.04.2018 | Кто первый космонавт? |
||
25.04.2018 | Планета, на которой мы живём. 8.05.2018 | Великий праздник «День Победы».Какая наша Родина – Россия? |
||
23.05.2018 | Какая наша Родина – Россия? |
|||
Средние группы | 2.05.2018 | Что ты знаешь о празднике «Великой победы»? |
||
16.05.2018 | Кто мы жители страны России? |
Итог «Рефлексивных кругов» за год:
Дети умеют вежливо общаться друг с другом и с окружающими взрослыми. Умеют вести диалог, при этом используют различные средства выразительности. Дети внимательно слушают друг друга и понимают.
ПОДВЕДЕНИЕ ИТОГОВ ДЕЛА (РЕФЛЕКСИЯ)
«ДЕРЕВО НАСТРОЕНИЙ»
На листе ватмана рисуется дерево – каждая веточка – это отдельный день. Вечером ребенок на сегодняшней веточке может нарисовать листочек одного из трех цветов. зеленый означает, что настроение у ребенка отличное, желтый – хорошее, красный – так себе. К концу смены у вас появится полная картина того, как она прошла для ваших детей.
«С НЕБА ЗВЕЗДОЧКА УПАЛА»
Детям говорится о том, что, когда падают звезды, можно загадывать желание и многие люди, вувидев падающую звезду, загадывают самое заветное желание и оно обязательно сбывается. Ребята пишут на своей звезде (вырезанной из картона), чего они ждут от этой смены. Вожатый собирает все звезды и вешает их на стену. В конце смены их снимают, читают пожелания и вместе обсуждают, что сбылось, а что нет
«ЧЕМОДАНЧИК В ДОРОГУ»
В волшебный чемоданчик можно положить что угодно и оно сохранится в неизменном виде. Каждый выбирает три вещи, которые он хотел бы унести с занятия: хорошее настроение, друга, стул, на котором он сидит.
«ЗАКОНЧИТЕ ПРЕДЛОЖЕНИЕ»
Сегодняшний день - это:
Мое настроение сегодня:
Я хотел бы, чтобы завтра:
Опираясь на высказывания детей, вожатый подводит итог дня.
Попрощаемся как на Адаманских островах в Тихом океане.
Положите правую ладошку под ладошку соседа справа; а левую - на ладошку соседа слева. И с самыми добрыми и светлыми пожеланиями, с самой положительной энергией дуем на ладошку соседа справа.
“Конверт откровений”
Вожатый заранее заготавливает конверт с большим количеством вопросов. Желательно, чтобы вопросы носили нравственно-этический характер, типа:
что ты больше всего ценишь в людях?
какая твоя самая большая цель в жизни?
какие черты характера человека тебе особенно неприятны?
на кого из известных героев прошлого (фильма, книги) ты хотел бы быть похожим и почему? и т.д.
"По одежке встречают …"
Этот этап работы вызывает интерес и легкое волнение у членов группы. В процессе поиска своего «портрета» им приходится прочитать не один, а несколько листочков, «поспорить» с кем-то из претендентов за одну и ту же характеристику, суметь отстоять свое право на нее. При обсуждении ведущий предлагает ответить на несколько вопросов:
Удовлетворены ли вы тем, что написано на полученном листочке?
Что вызвало удивление, произошли ли «открытия»?
Что вызвало наибольший интерес в процессе работы?
Какие трудности испытывали при выполнении упражнения?
Гороскоп
2-3 день смены.
Дети распределяются по группам - знакам зодиака. Перед высказыванием - краткая характеристика знака. Необычная характеристика детей, форма запоминания личности через выделение необычных качеств. Можно сравнивать по сезонам года, цвету глаз и т.д.
Уровень отряда -- низкий.
Ситуативный
(Электрический стул)
Один участник находится спиной к аудитории, все пишут записки с краткой характеристикой этого человека, которые потом зачитываются ведущим (корректирующим текст в случае его некорректности по отношению к человеку).
Дает возможность дать оценку поведения того или иного ребенка членам отряда без амбиций, обид, оскорблений его личного достоинства.
Свеча - прожитый день.
Ребята садятся в круг и, передавая свечку друг другу, рассказывают по очереди, как прошел для них день и оценка его.
Свеча - желание.
Передавая свечку по кругу, к обычной оценке дня можно добавить свои пожелания на завтра. Можно начать словами: "Я бы хотела, чтобы завтра…"
Паутинка.
Все садятся в круг. Вожатый берет клубок ниток, наматывает нитку на свой палец и передает этот клубок любому ребенку из круга ("Я хотел бы передать этот клубок Кате, потому что…"). Далее второй участник наматывает свою ниточку на палец, и передает клубок следующему, объясняя свой выбор. И так далее, пока все не будут связаны одной ниточкой. Можно увидеть те связи, которые возникли между ребятами в отряде. Каждый может отрезать, намотанную на палец ниточку на память.
«Пять минут откровения»
Весь отряд в течение всего дня складывает в коробку в виде почтового ящика записки с вопросами, которые они хотели бы задать своим вожатым на итоговом «огоньке». На «огоньке» на эти вопросы отвечают вожатые.
«Записки»
Изготавливаются конверты и маленькие записочки. Количество конвертов равно количеству детей в отряде. На записках каждый ребёнок пишет пожелания, слова благодарности, впечатления от каждого человека из отряда. Эти записки вкладываются в конверты, которые творчески оформлены и подписаны. Затем эти конверты в творческой форме вручаются их владельцам. Но только на следующий день разрешается открыть конверты и прочитать записки.
Наряду с рефлексивными играми возможным методом теоретико-игрового моделирования в условиях неполной информированности являются байесовы игры, предложенные в конце 60-х годов XX в. Дж. Харшаньи . В байесовых играх вся частная (т. е. не являющаяся общим знанием) информация, имеющаяся у агента на момент выбора им своего действия, называется типом агента. При этом каждый агент, зная свой тип, имеет и предположения о типах остальных агентов (в виде вероятностного распределения). Формально байесова игра описывается следующим набором:
- - множеством N агентов;
- - множествами /?, возможных типов агентов, где тип /-го агента
Множеством X’ = J - [ X х допустимых векторов действий аген-
- -набором целевых функций /: R’x X ’-> 9? 1 (целевая функция агента зависит в общем случае от типов и действий всех агентов);
- - представлениями F,(-|r,) е Д(/?_,), /" е N, агентов (здесь через /?_, обозначено множество всевозможных наборов типов всех агентов, кроме /-го, R.j = П R t , а через Д(/?_,) обозначено множесг-
во всевозможных вероятностных распределений на /?_,). Решением байесовой игры является равновесие Байеса-Нэша, определяемое как набор стратегий агентов вида х *: R, -> X h i е N,
которые максимизируют математические ожидания соответствующих целевых функций:
где jcобозначает набор стратегий всех агентов, кроме /-го. Подчеркнем, что в байесовой игре стратегией агента является не действие, а функция зависимости действия агента от его типа.
Модель Дж. Харшаньи можно интерпретировать различным образом (см. ). В соответствии с одной интерпретацией все агенты знают априорное распределение типов F{r) е Д(R ’) и, узнав собственный тип, вычисляют из него по формуле Байеса условное распределение Fj(r.i | г,). В этом случае представления агентов {F,(-|-)}, sW называются согласованными (и, в частности, являются общим знанием - каждый агент может их вычислить, знает, что эго могут сделать остальные и т. д.).
Другая интерпретация состоит в следующем. Пусть существует некоторый набор потенциальных участников игры всевозможных типов. Каждый такой «потенциальный» агент выбирает свою стратегию в зависимости от своего типа, после чего случайным образом выбирается п «актуальных» участников игры. В этом случае представления агентов, вообще говоря, не обязательно согласованы (хотя и являются общим знанием). Отметим, что в эта интерпретация названа игрой Зельтена (Р. Зельген - лауреат Нобелевской премии по экономике 1994 года, вместе с Дж. Нэшем и Дж. Харшаньи).
Теперь рассмотрим ситуацию, когда условные распределения не обязательно являются общим знанием. Удобно описывать ее следующим образом. Пусть выигрыши агентов зависят от их действий и от некоторого параметра в е 0 («состояния природы», которое может интерпретироваться и как набор типов агентов), значение которого не является общим знанием, т. е. целевая функция /-го агента имеет вид f i {0,x x ,...,x n): 0 х X’ -» "Л 1 , /" е N. Как было отмечено во второй главе данной работы, выбору агентом своей стратегии логически предшествует информационная рефлексия - размышления агента о том, что каждый агент знает (предполагает) о параметре 0, а также о предположениях других агентов и пр. Тем самым, мы приходим к понятию структуры информированности агента, отражающей его информированность о неизвестном параметре, о представлениях других агентов и т. д.
В в рамках вероятностной информированности (представления агентов включают в себя следующие компоненты: вероятностное распределение на множестве состояний природы; вероятностное распределение на множестве состояний природы и распределениях на множестве состояний природы, характеризующих представления остальных агентов, и т. д.) было построено универсальное пространство возможных взаимных представлений (universal beliefs space). При этом игра формально сводится к некоей «универсальной» байесовой игре, в которой типом агента является вся его структура информированности. Однако предложенная в конструкция настолько громоздка, что найти решение «универсальной» байесовой игры в общем случае, по-видимому, невозможно.
В данном разделе мы ограничимся рассмотрением игр двух лиц, при этом представления агентов задаются точечной структурой информированности (у агентов имеются вполне определенные представления о значении неопределенного параметра; о том, каковы представления (также вполне определенные) оппонента, и т. д.) С учетом этих упрощений нахождение равновесия Байеса-Нэша сводится к решению системы двух соотношений, определяющих две функции, каждая из которых зависит от счетного числа переменных (см. ниже).
Итак, пусть в игре участвуют два агента с целевыми функциями
причем функции f и множества Х ь 0 являются общим знанием. Первый агент имеет следующие представления: неопределенный параметр равен 0 е 0; второй агент считает, что неопределенный параметр равен в ]2 е 0; второй агент считает, что первый агент считает, что неопределенный параметр равен в 2 е 0 и т. д. Таким образом, точечная структура информированности первого агента /, задается бесконечной последовательностью элементов множества 0; пусть, аналогично, и у второго агента имеется точечная структура информированности 1 2:
Посмотрим теперь на рефлексивную игру (2)-(3) с «байесовой» точки зрения . Типом агента в данном случае является его структура информированности /, /=1, 2. Для нахождения равновесия Байеса-Нэша необходимо найти равновесные действия агентов всевозможных типов, а не только некоторых фиксированных типов (3).
Легко видеть, какими будут в данном случае распределения F,(-|-) из определения равновесия (1). Если, например, тип первого агента 1={6, 0 !2 , 0ш, ...), то распределение Fi(-|/i) приписывает вероятность 1 типу оппонента / 2 =(0 | 2 , 012ь 0Ш2, ) и вероятность О остальным типам. Соответственно, если тип второго агента ^2 = (02> $2ь Фиг* )> то распределение F 2 (-|/ 2) приписывает вероятность 1 типу оппонента 1=(в 2 , 0 212 , 02:2и ) и вероятность 0 остальным типам.
Для упрощения записи будем использовать в дальнейшем следующие обозначения:
Введем также обозначения
В этих обозначениях точечное равновесие Байеса-Нэша (1) записывается как пара функций {(pi-), i//(-)), удовлетворяющих условиям
Заметим, что в рамках точечной структуры информированности 1-й агент уверен, что значение неопределенного параметра равно 0, (вне зависимости от представлений оппонента).
Таким образом, для нахождения равновесия необходимо решить систему функциональных уравнений (4) для определения функций (р(-) и!//( ), каждая из которых зависит от счетного числа переменных.
Возможные структуры информированности могут иметь конечную либо бесконечную глубину. Покажем, что применение концепции равновесия Байеса-Нэша к агентам со структурой информированности бесконечной глубины дает парадоксальный результат - для них равновесным является любое допустимое действие.
Определим понятие конечности глубины структуры информированности применительно к случаю игры с двумя участниками, когда структура информированности каждого из них является бесконечной последовательностью элементов из 0.
Пусть даны последовательность Т= {t j } " =[ элементов из 0 и целое неотрицательное число к. Последовательность (о к {Т)= {t t } /=i+1
будем называть к-окончанием последовательности Т.
Будем говорить, что последовательность Т имеет бесконечную глубину, если для любого п найдется к>п такое, что последовательность со к (Т) не совпадает (имеется в виду обычное поэлементное совпадение) ни с одной из последовательностей набора а>и(Г)=Т, (0 (Т),..., (о п (Т). В противном случае последовательность Т имеет конечную глубину.
Иначе говоря, последовательность конечной глубины имеет конечное число попарно различных окончаний, в то время как у последовательности бесконечной глубины их бесконечно много. Например, последовательность (1, 2, 3, 4, 5, ...) имеет бесконечную глубину, а последовательность (1, 2, 3, 2, 3, 2, 3, ...) - конечную.
Рассмотрим игру (2), в которой целевые функции f, f 2 и множества Х, Х 2 , 0 обладают следующим свойством:
(5) для любых Л"| е Х, х 2 е Х 2 , в е 0 множества
Условия (5) означают, что для любого в е © и любого действия Xi е Х у второго агента существует хотя бы один наилучший ответ и, в свою очередь, само действие Х является наилучшим ответом на какое-то действие второго агента; аналогично и любое действие
Х 2 G Х 2 .
Оказывается, что при выполнении условий (5) в игре (2) любое действие агента со структурой информированности бесконечной глубины является равновесным (г. е. является компонентой некоторого равновесия (4)). Эго справедливо для обоих агентов; для определенности сформулируем и докажем утверждение для первого.
Утверждение 2.10.1 .Пусть в игре (2), в которой выполнены условия (5), существует хотя бы одно точечное равновесие Байеса- Нэша (4). Тогда для любой структуры информированности бесконечной глубины 1 и любого % е Х существует равновесие (*,*( )> х*(-)), в котором х*(/,) =х-
Идея доказательства состоит в конструктивном построении соответствующего равновесия. Зафиксируем произвольное равновесие (1. В силу условий (4) значение функции ф ( ) принимала на структуре 1 значение х-
Доказательству утверждения 2.10.1 предпошлем четыре леммы, для формулировки которых введем обозначение: если р=(р, ...,/>„) - конечная, а Т= {/.}", - бесконечная последовательности элементов
из 0, торТ= 0, h, ...)
Лемма 2.10.1. Если последовательность Т имеет бесконечную глубину, го для любой конечной последовательности р и любого к последовательностьрсо к (Т) также имеет бесконечную глубину.
Доказательство. Поскольку Т имеет бесконечную глубину, у нее бесконечное множество попарно различных окончаний. При переходе от Т к ы к {Т) их число уменьшается не более, чем на к , все равно оставаясь бесконечным. При переходе от со к (Т) к ры к {Т) число попарно различных окончаний, очевидно, не уменьшается.
Лемма 2.10.2. Пусть последовательность Т представима в виде Т=ррр где р - некоторая непустая конечная последовательность. Тогда Т имеет конечную глубину.
Доказательство. Пусть р имеет вид р=(р, Тогда элементы последовательности Т связаны соотношениями t i+nk = t, для всех целых / > 1 и к > 0. Возьмем произвольноеу-окончание,у > п. Число j единственным образом представимо в виде j = i + п к, где /е{1, ...,«}, А">0. Нетрудно показать, что a>(T) = (о,{Т) для любого целого m > 0 выполняется = t i+ „ k+m =
С учетом произвольности j мы показали, что у последовательности Т не более п попарно различных окончаний, т. е. ее глубина конечна.
Лемма 2.10.3. Пусть для последовательности Т выполняется тождество Т = р Т, где р - некоторая непустая конечная последовательность. Тогда Т имеет конечную глубину.
Доказательство. Пусть р = (/? ь ...,р„). Имеем:
Т=р Т=рр Т=ррр Т=рррр Т= ... . Таким образом, для любого целого к> 0 фрагмент (/„*+, ..., /„*+„) совпадает с (р ь Поэтому
Т представима в виде Т = ррр... и, согласно лемме 2.10.2, имеет конечную глубину.
Лемма 2.10.4, Пусть для последовательности Т выполняется тождество р Т = q Т, где р и q - некоторые нетождественные непустые конечные последовательности. Тогда Т имеет конечную глубину.
Доказательство. Пусть р = (/;, . и q = (q b ..., q k). Если п = к, го, очевидно, тождество pT=q Т не может выполняться. Поэтому рассмотрим случай пФк. Пусть для определенности п > к. Тогда р = (q u ..., q k ,p k+ , ...,р„), и из условияpT=q Т следует, что d Т= Т, где d = (j ) k+ 1 , ...,р п). Применяя лемму 2.10.3, получаем, что глубина последовательности Т конечна.
Доказательство утверждения 2.ЮЛ. Пусть имеется произвольная структура информированности первого агента бесконечной глубины - для единообразия с леммами 2.10Л-2Л0.4 будем обозначать ее не /, а Т= (t, t 2 , . По условию утверждения, существует по крайней мере одна пара функций!//( )), удовлетворяющая соотношениям (4); зафиксируем любую из таких пар. Положим значение функции ф ( ) на последовательности Т равным
X". ф(Т) = х (здесь и далее для «заново определяемых» функций будем применять обозначения ф ( ) и ф ( )) Подставляя Т в качестве аргумента функции ф ( ) в соотношения (4), получаем, что значение ф (Т) = х связано (в силу (4)) со значениями функции ф ( ) на последовательности (0 (Т), а также на всех таких последовательностях 7”,
ДЛЯ КОТОРЫХ СО(Т’)= Т.
Выберем значения функции ф ( ) на этих последовательностях таким образом, чтобы выполнялись условия (4):
где t е Q; из (5) вытекает, что эго можно сделать. Если множество BR"(t,x) или BR 2 {t,x) содержит более одного элемента, возьмем любой из них.
р(* 3 ,/ 4 ,...) € BR 2 "(t 2 , а, подставляя (t , t 2 , t 2 , ...), выберем
Продолжая подставлять уже полученные значения в соотношения (4), можно последовательно определить значения функции ф ( ) на всех последовательностях вида
где (т + к) - нечетное, и значения функции ф (?) на последовательностях вида (6) с четным (т + к). Далее будем считать, что в (6) при т> 1 выполняется Ф t m ., - тогда представление в виде (6) является
однозначным.
Алгоритм определения значения функций на последовательностях вида (6) состоит из двух этапов. На первом этапе полагаем ф (Т)=х и определяем значения соответствующих функций на последовательностях со,„(Г) = (t„„ t m+ 1, ...), m > 1 (т. e. при k= 0), попеременно применяя отображения ДД, 1 и 5/?, 1 .
На втором этапе для определения значения соответствующих функций на последовательностях (6) при к > 1 исходим из определенного на первом этапе значения на последовательности (t„„ t„,+ 1, ...), применяя попеременно отображения BR и BR 2 .
Согласно лемме 1 все последовательности вида (6) имеют бесконечную глубину. Согласно лемме 4 все они попарно различны (если бы какие-либо две последовательности вида (6) совпадали, эго противоречило бы бесконечности глубины). Поэтому, определяя значения функций ф ( ) и ф ( ), мы не рискуем присвоить одному и тому же аргументу разные значения функции.
Таким образом, мы определили значения функций ф ( ) и ф ( ) на последовательностях вида (6) таким образом, что эти функции по- прежнему удовлетворяют условиям (4) (т. е. являются точечным равновесием Байеса-Нэша) и при этом ф (Т) = %. Утверждение 2. К). 1 доказано.
Итак, выше введено понятие точечного равновесия Байеса- Нэша. Доказано, что при выполнении дополнительных условий (5) любое допустимое действие агента, имеющего структуру информированности бесконечной глубины, является равновесным. (Все рассмотрения проводились для игры с двумя участниками, однако можно выдвинуть гипотезу о том, что полученный результат допускает обобщение на случай игры с произвольным числом участников.) Эго обстоятельство, по-видимому, свидетельствует о нецелесообразности рассмотрения структур бесконечной глубины как в терминах информационного равновесия, так и в терминах равновесия Байеса-Нэша.
В более общем плане можно отметить, что доказанное утверждение является аргументом (причем не единственным, см., например, разделы 2.6 и 3.2) в пользу неизбежной ограниченности ранга информационной рефлексии принимающих решение субъектов.