Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа. Применение теории игр для оптимизации принимаемых решений

Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа. Применение теории игр для оптимизации принимаемых решений

Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа. Применение теории игр для оптимизации принимаемых решений

Критерий пессимизма-оптимизма Гурвица

В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска.

Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма.

Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях .

Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:

Wi = Cminj aij + (1-C) maxj aij (1.4.3)

Где C – коэффициент пессимизма.

Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально: W = max Wi

При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий азартного игрока, делающего ставку на то, что «выпадет» наилучший случай.

Критерий Гурвица применяется в ситуации, когда:

1. Информация о состояниях окружающей среды отсутствует или недостоверна;

3. Реализуется только малое количество решений;

4. Допускается некоторый риск.

Критерий Ходжа-Лемана

Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале .

Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае ММ-критерий

Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле:

где u – параметр достоверности информации о вероятностях состояний окружающей среды.

Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально: W = max Wi

Данный критерий применим в следующем случае :

1. Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;

2. Принятое решение теоретически допускает бесконечно много реализаций;

3. При малом числе реализации допускается некоторый риск.

Пример решения статистической игры

Рассмотрим пример решения статистической игры в экономической задаче.

Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации – с осени до начала лета следующего года.

Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации:

A1 – реализовать всю капусту осенью, непосредственно после уборки;

A2 – заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев;

A3 – заложить всю капусту на хранение и реализовать её в весенние месяцы.

Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц.

На региональном рынке капусты может сложиться одна из следующих трёх ситуаций:

S1 – поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта;

S2 – в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен – в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации;

S3 – в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной. Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются. Поэтому рынок испытывает значительные сезонные колебания цен.

Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 6.

Выручка от реализации капусты, тыс. д.е.

В задаче необходимо определить:

1. Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно;

2. Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо:

а) получить минимально гарантированный выигрыш;

б) учесть значения риска от принятия различных решений;

в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3;

3. Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7;

4. Дать экономическую интерпретацию результатов решения задачи.

1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (таблица 7).

Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты

Читать еще:  Самые выигрышные лотереи в россии. Самые крупные выигрыши в лотерею в России: список и интересные факты Самые выигрышные российские лотереи

Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 (W = 6,3)

3. Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма (на рисунке – ПО-критерий, таблица 9).

Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма

Значения Wi для ММ-критерия найдём по формуле:

W1 = min (10, 5, 2) = 2

W2 = min (0, 10, 3) = 0

W3 = min (-10, 0 20) =-10

Оптимальной стратегией по максиминному критерию является стратегия A1 (W = 2).

Определим оптимальную стратегию по критерию недостаточного основания Лапласа.

По данному критерию оптимальной является стратегия A1 (W = 5,67).

По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 (формула (6)) – стратегия A3 (W = 11).

4. Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (таблица 10).

Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков

По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 (W = 4,94).

6. Проведём экономическую интерпретацию результатов решения задачи.

Если предприятие имеет информацию о вероятностях состояния рынка капусты и значения этих вероятностей соответствуют исходным данным задачи, наиболее выгодной стратегией является продажа части капусты в осенние месяцы и хранение оставшейся капусты для реализации в течение зимних месяцев (прибыль составит 6,3 тыс. д.е.).

Эта же стратегия является наиболее эффективной, если информация о вероятностях состояний рынка капусты отсутствует и пользователю необходимо минимизировать степень возможного риска потери прибыли в процессе принятия решения (значение возможного риска составит 17 тыс. д.е.).

В случае, когда при отсутствии информации о состоянии рынка наиболее существенным для пользователя является не максимизация прибыли в абсолютном выражении, а получение её гарантированного объема, хотя бы и минимального, наиболее целесообразным решением является реализация всей капусты в осенние месяцы (прибыль составит 2 тыс. д.е.).

Это же стратегия является наиболее выгодной, если пользователь имеет информацию о вероятностях состояний рынка, соответствующую исходным данным, но эта информация не вполне достоверна (в случае, если информация имеет достоверность 0,7, прибыль составит 4,94 тыс. д.е.).

В случае, если информация о вероятностях состояний рынка отсутствует и риск значительных потерь не является для пользователя определяющим фактором при принятии решения, или если есть основания для оптимистической оценки ситуации на рынке капусты, при котором пользователь имеет возможность получить наибольшую прибыль от производства капусты, ему следует сохранить произведённую продукцию и реализовать её в весенние месяцы (прибыль составит соответственно 5.7 и 11 тыс. д.е.).

принятие решение оптимальный программный

Обозначается – HL-критерий. Представляет собой взвешенную сумму критериев Байеса-Лапласа и МиниМаксного.

где v – весовой коэффициент,
и отражает степень доверия к используемому распределению вероятностей.

Если v=0 – критерий HL совпадает с ММ-критерием;

Если v=1 – критерий HL совпадает с критерием Байеса-Лапласа.

Данный критерий применяется:

Вероятность появления событий F j – неизвестны, но можно сделать некоторые предположения.

Принятие решений теоретически реализуется и при малых числах реализации допускается некоторый риск.

В этом критерии оценочная функция представляет собой средневзвешенное между точками зрения крайнего оптимизма и крайнего пессимизма.

где с – весовой коэффициент. Обычно с=0,5. Тогда получаем среднее взвешенное.

Правило выбора согласно критерию Гурвица, формируется следующим образом:

матрица решений
дополняется столбцом, содержащим среднее взвешенное наименьшего и наибольшего результатов для каждой строки. Выбираются только те варианты, в строках которых стоят наибольшие элементы
e ij этого столбца.

Если с=1 – критерий азартного игрока;

Если с=0 – критерий минимаксов.

Применяется этот критерий:

о вероятности наступления событий ничего не известно;

решение принимается малое число раз и допускается некоторый риск.

С – показывает степень допустимого риска.

Составной критерий Байеса-Лапласа и МиниМаксного критериев BL (MM )

Данный критерий позволяет управлять величиной допустимого риска и более того, позволяет выбрать решение, в котором риск будет оправдан.

Идея этого критерия: вначале находится решение по МиниМаксному критерию и это решение используют в качестве опорного. После этого выбирают уровень допустимого риска, т.е. величину на которую возможный выигрыш может быть меньше, чем в опорном решении (в худшем случае). Из дальнейшего рассмотрения исключаются все решения, у которых величина риска превышает допустимый. Обозначим i 0 – номер опорного решения.

– величина допустимого риска.

В результате получаем множество решений. Это дает возможность выбрать среди них решения, в которых риск оправдан, т.е такие решения, дополнительный выигрыш которых в лучшем случае по сравнению с базовым вариантом превышает возможный проигрыш в худшем случае.

Пример: пусть некую технологическую установку требуется подвергнуть проверке с приостановкой ее работы. К текущему моменту времени установка может находиться в одном из трех состояний:

Читать еще:  Утилизатор на че как принять участие. Как принять участие в программе "Утилизатор" на телеканале "ЧЕ"

F 1 – неисправностей нет и установка может продолжать работу;

F 2 – требуется незначительный ремонт отдельных деталей;

F 3 – дальнейшая эксплуатация установки возможно только после капитального ремонта.

E 1 – осуществить полную проверку оборудования с привлечением специалистов со стороны;

E 2 – провести осмотр и возможный ремонт своими силами;

E 3 – отказаться от проверки и не приостанавливать выпуск продукции.

Исходя из опыта, предприятие построило следующую матрицу, приняв во внимание основной критерий – затраты на проверку и ремонт.

Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа. Применение теории игр для оптимизации принимаемых решений

Критерий недостаточного основания Лапласа

Данный критерий используется при наличии неполной информации о вероятностях состояний окружающей среды в задаче принятия решения. Вероятности состояний окружающей среды принимаются равными и по каждой стратегии ЛПР в платёжной матрице определяется, таким образом, среднее значение выигрыша:

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально: W = max Wi

Использование данного критерия оправдано в следующей ситуации:

1. ЛПР не имеет информации, либо имеет неполную информацию о вероятностях состояний окружающей среды;

2. Вероятности состояний окружающей среды близки по своим значениям;

3. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша [18].

Максиминный критерий Вальда

Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:

Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР: Wi = minj aij

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально: W = max Wi

Выбранная таким образом стратегия полностью исключает риск.

Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется.

Это свойство позволяет считать ММ-критерий одним из фундаментальных.

Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:

1. О возможности появления состояний окружающей среды ничего не известно;

2. Решение реализуется только один раз;

3. Необходимо исключить какой бы то ни было риск [19].

Критерий минимаксного риска Сэвиджа

Величина (amax j – aij ), где amax j – максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии.

Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией.

На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска [20].

Для определения оптимальной стратегии по данному критерию на основе платёжной матрицы рассчитывается матрица рисков, каждый коэффициент которой (rij) определяется по формуле: rij = amax j – aij

Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий ЛПР: Ri = maxj rij

Оптимальной по данному критерию считается та стратегия, в которой значение Ri минимально: W = min Ri

Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ-критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша.

Статистические игры и принятие решений в условиях неопределенности. Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа

Критерий Байеса – правило, в соответствии с которым стратегия решений выбирается таким образом, чтобы обеспечить минимум среднего риска. Применение критерия Байеса целесообразно в случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов или явлений в условиях неизменного признакового пространства, при стабильном описании классов и неизменной платежной матрице.

Минимум риска, усредненного по множеству решений задачи распознавания неизвестных объектов, обеспечивается тогда, когда решения о принадлежности объектов классу Ω 1 и Ω 2 принимаются в соответствии со следующим правилом: если измеренное значение признака у данного объекта расположено в области R 1 то объект относится к классу Ω 1 если в области R 2 – к классу Ω 2

Стратегию, основанную на этом правиле, называют байесовской стратегией, а минимальный средний риск – байесовским риском.

Использование другой стратегии, отличной от байесовской, сопряжено с увеличением среднего риска. Пусть, например, используется некоторая стратегия А, в соответствии с которой решение о принадлежности объекта классу Ω 1 принимается тогда, когда измеренное значение признака х=х 0 х А (рис. 4.2).

Разность среднего риска Rã А при подобной стратегии и байесовского риска Rã min в предположении, что с 11 =c 22 = 0, c 12 = c 1 и с 21 = с 2 , составит

В области r 2 ÎR 2 .f 2 (x)>l 0 f 1 (x). Значит, Rã A -Rã min >0, т. е. Rã A >Rã min

Читать еще:  План каждый день новый год. Определиться, как, где и с кем хотелось бы провести новогоднюю ночь. Надуть мыльные пузыри на морозе

При выборе стратегии В, в соответствии с которой принимается решение о принадлежности объекта классу Ω 1 если х х B , разность средних рисков подобной и байесовской стратегии

В области Значит, Rã B -Rã min >0, т. е. Rã B >Rã min т. е.

Байесовская стратегия может быть описана также следующим образом. Пусть в результате опыта установлено, что значение признака у распознаваемого объекта w составляет величину х=х 0 . Тогда условная вероятность принадлежности объекта классу Ω 1 (условная вероятность первой гипотезы в соответствии с теоремой гипотез или формулой Байеса)

а условная вероятность принадлежности объекта классу Ω 2 (условная вероятность второй гипотезы)

где – совместная плотность распределения вероятностей значений признака х по классам, в свою очередь величины – апостериорные вероятности, принадлежности распознаваемого объекта классам Ω 1 и Ω 2 , соответственно.

Условные риски, связанные с решениями wÎΩ 1 и wÎΩ 2 , соответственно

Система распознавания, основанная на байесовской стратегии, должна решать задачу с минимальным условным риском. Это значит, что предпочтение решению coeCli следует отдавать тогда, когда Подставим в это выражение значения определяемые (4.29). Тогда неравенства или определят, в каких условиях необходимо принять решение о том, что wÎΩ 1

Таким образом, байесовский подход к решению задачи распознавания состоит в вычислении условных апостериорных вероятностей и принятии решения на основании сравнения их значений. Именно такой подход обеспечивает минимум среднего риска и минимум ошибочных решений.

Если число классов больше двух и равно т, то апостериорная вероятность отнесения объекта к Ω-му классу будет

Когда объект характеризуется N признаками x j , j=1, . N и признаки распознаваемого объекта приняли значения x 1 = x 0 1 ; х 2 = х 0 2 ; . ; x N =x 0 N , вероятность того, что при осуществлении события a N =(x 0 1 , x 0 2 , . х 0 N) объект относится к i-му классу, равна

Рассмотрим другую форму записи байесовского критерия отнесения объекта к соответствующему классу. Пусть имеются классы Ω 1 и Ω 2 . Априорные вероятности появления объектов этих классов соответственно P(Ω 1) и Р(Ω 2), с 11 = с 22 = 0, c l 2 = c 1 и с 21 = с 2 . Известны также многомерные условные плотности распределения вероятностей значений признаков f 1 (х 1 . x N) и f 2 (х 1 . x N) по классам. Тогда условные вероятности ошибок первого и второго рода соответственно

Так как интеграл от плотности вероятности по областям R 1 и R 2 равен единице, то

Задача состоит в том, чтобы минимизировать значение среднего риска. Для этого необходимо так выбрать области R 1 и R 2 , чтобы интеграл в (4.34) принял наибольшее отрицательное значение. Это достигается тогда, когда подынтегральное выражение принимает наибольшее отрицательное значение и вне области R 1 не существует такой области, где подынтегральное выражение отрицательно, т. е. с 2 Р(Ω 2)f 2 (х 1 . x N) – c 1 P(Ω 1)f 1 (х 1 . x N) „ . />,„), д = ( 0 и определяется множество согласия Величины £,-=£^0- ште^ё 1 характеризуют наиболее возможные потери в сравнении с е^. После этого формируется выигрышное множество /2. Множеству /] п ¡2 принадлежат варианты решений, для которых в определенных состояниях могут иметь потери по сравнению с состоянием, задаваемым минимаксным критерием, однако в других состояниях имеется, по меньшей мере, прирост выигрыша.

Таким образом, рассмотренные методы позволяют расширить классы методов, используемых для принятия решений в условиях неполной статистически заданной неопределенности на основе обработки таблиц экспертных оценок.

максимизируется средний выигрыш статистика

· Показатель оптимальности стратегии – величина среднего риска.

За оптимальную стратегию принимается чистая стратегия , при которой минимизируется средний риск

Байесовское решение является оптимальным не в каждом отдельном случае, а в среднем. Такого рода оптимальность реально может проявить себя лишь при многократном проведении операции , когда среднее значение постепенно стабилизируется.

Применение критерия Байеса оправданно, если ситуация, в которой принимается решение, характеризуется признаками :

известны и не зависят от времени;

§ решение реализуется большое (теоретически бесконечное) число раз.

Пример 2 . Фирма купила станок за 100 ден. ед. Для его ремонта можно купить специальное оборудование за 50 ед. или обойтись старым оборудованием. Если станок выходит из строя, его ремонт с помощью спецоборудования обходится в 10 ед., без спецоборудования – в 40 ед.

Известно, что в течение срока эксплуатации станок выходит из строя не более трех раз: вероятность того, что станок не сломается – 0,3; сломается 1 раз – 0,4; сломается 2 раза – 0,2; сломается 3 раза – 0,1.

Требуется определить целесообразность приобретения специализированного ремонтного оборудования.

Формализация . Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы – второго игрока – четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша – затраты фирмы на покупку и ремонт станка, задается платежной матрицей:

Источники:

http://dvoris.ru/na-novyjj-god/ekspertnye-ocenki-minimaksnogo-metoda-i-metodov-baiesa/
http://studbooks.net/2039037/informatika/kriteriy_nedostatochnogo_osnovaniya_laplasa
http://www.reaestate.ru/statisticheskie-igry-i-prinyatie-reshenii-v-usloviyah-neopredelennosti-ekspertnye-ocenki-minimaksnogo-m/

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии