Смотреть страницы где упоминается термин лапласа критерий. Статистические игры и принятие решений в условиях неопределенности

Вероятности состояний природы, предполагаемые известными при применении критерия Байеса, могли быть получены из статистических данных, отражающих многократное решение подобных задач, или в результате наблюдений за частотой пребывания природы в том или ином состоянии. Однако довольно часто складываются ситуации, в которых определить вероятности состояний природы нет возможности. Желая все же принять решение о выборе стратегии в условиях риска, оценивают вероятности состояний природы субъективно. Один из субъективных подходов состоит в том, что лицо, принимающее решение, нс может отдать предпочтение ни одному из состояний природы по частоте его наступления и потому считает их равновероятными, т.с. =п~‘,j = 1,2,...,л. Этот принцип называется "принципом недостаточного основания" Лапласа . Па нём основан определяемый ниже критерий Лапласа {If -критерий), представляющий собой частный случай критерия Байеса, когда вероятности состояний задаются указанным образом.

Пусть имеем игру с природой, задаваемой матрицей А (см. (2.5.1)) выигрышей игрока А, а = (, = n~",q 2 =л _|) - вектор вероятностей состояний природы, удовлетворяющих очевидно условиям (2.1.1). Таким образом, в данном случае координаты вектора q зависят от числа состояний природы определенным образом, в то время, как в общем случае зависимость этого вектора от состояний природы состоит только в том, что число его координат равно числу состояний природы.

Из определения критерия Байеса оптимальности чистых стратегий относительно вышрышей получаем следующее определение.

Пьер-Симон Лаплас (23.03.1749 - 05.03.1827)

Критерием Лапласа относительно выигрышей (V’ - критерием) называется критерий, но которому:

- показателем (W -показателем) эффективности чистой стратегии А , (/ = 1,2,...,от) назовем среднее арифметическое выигрышей при этой стратегии, т.с. величину

- ценой (II -ценой) игры в чистых стратегиях назовем наибольший из показателей эффективности (2.7.1):

- оптимальной (II -оптимальной) во множестве чистых стратегий назовем стратегию A k eS L с максимальным показателем эффективности

Из (2.7.2) и (2.7.3) следует, что оптимальность стратегии A k эквивалентна равенству 1!’ к = /,((. Поскольку в правой части формулы (2.7.1) множитель п~" инвариантен относительно номера стратегии, то эффективность стратегий по И - критерию можно характеризовать просто суммами > « = 1,2,...,т. Таким образом, чистая стратегия А к будет II -оптимальной во множестве чистых стратегий, если сумма выигрышей в А-й строке матрицы выигрышей будет максимальной.

Множество стратегий, V" -оптимальных во множестве чистых стратегий, обозначим (s c)° {LP) .

Поскольку критерий Лапласа сеть частный случай критерия Байеса, то все предложения, сформулированные в § 2.5 о критерии Байеса, будут справсдливыми и для критерия Лапласа при замене в них вектора q = (q x ,q 2 ,...,q n) вектором q = (q l =n~",q 2 =n~...,q ll =n~").

Из оценок (2.5.5) и (2.5.6) для показателя эффективности Ц’ и цены игры L p c соответственно получаем:

Необходимость многократного принятия решения о выборе стратегии приводит к использованию смешанных стратегий, оптимальность которых определяется по критерию Лапласа.

Из определения В 1 ’(q) -критерия оптимальности смешанных стратегий относительно выигрышей в частности получаем следующее определение.

По IP -критерию относительно выигрышей

- показателем (L p -показателем) эффективности смешанной стратегии Р = (р 1 ,р 2 ,...,р т) назовем среднее арифметическое вышрышей (2.2.3):

- ценой (L" -ценой) игры в смешанных стратегиях назовем наибольший из показателей эффективности (2.7.6):

- оптимальной (U’ -оптимальной) во множестве смешанных стратегий назовем стратегию Р° =(р“,/>?,...,/?") с наибольшим показателем эффективности:

Из равенств (2.7.7) и (2.7.8) следует, что для любой смешанной оптимальной стратегии справедливо равенство

Из теоремы 2.5.1 вытекает следующая теорема.

Теорема 2.7Л. В любой игре с природой существует стратегия, оптимальная во множестве смешанных стратегий по критерию Лапласа относительно выигрышей.

Множество И’ -оптимальных стратегий во множестве S смешанных стратегий обозначим через S oaP) .

Из теоремы 2.5.2 получаем следующую теорему.

Теорема 2.7.2. Показатель эффективности L’’(P ) смешанной стратегии P = (p l ,p 2 ,...,p m) по If -критерию представляет собой взвешенное среднее показателей эффективности Ц чистых стратегий ф, i = 1,2,.,.,т, по тому же критерию с весами р, / = 1,2.....т :

Из неравенств (2.5.12) следуют неравенства ^р > аГ

Из теоремы 2.5.3 следует теорема.

Теорема 2.7.3. По критерию Лапласа относительно выигрышей цены игры в чистых и в смешанных стратегиях совпадают: Ь р с = L p s .

Па основании этой теоремы можно общее значение I!" -цеп в чистых и в смешанных стратегиях назвать просто ценой игры по критерию Лапласа относительно выигрышей и обозначить через L p .

Следствие 2.7.1 (из теоремы 2.13). Для того чтобы чистая стратегия была оптимальной во множестве смешанных стратегий по критерию Лапласа относительно выигрышей необходимо и достаточно, чтобы она была оптимальной по тому же критерию во множестве чистых стратегий.

Теоретико-множественное выражение этого следствия состоит в справедливости равенства S 1 f|S ouf) = (S c , из которого следует, что множество (^C)O(i") ст р атсги й, V" -оптимальных во множестве 5 е чистых стратегий, является подмножеством множества ) стратегий, If -оптимальных во множестве 5 смешанных стратегий: (S L) оаГ) с: S 0{lf) .

Теорема 2.5.4 дает в частности следующее утверждение.

Теорема 2.7.4. Пусть (S L)° {ir) = {ф,ф 2 ,...,ф^, 1

стратегия Р, спектр которой является подмножеством множества {,/ 2 .....i k },

будет L" -оптимальной.

Если в условиях теоремы 2.7.4 1>2 и спектр стратегии Р содержит более одного номера, то эта оптимальная смешанная стратегия не является чистой.

Геометрическая интерпретация множества S смешанных И" - оптимальных стратегий дастся в следующей теореме.

Теорема 2 . 1 . 5 . Если (S c ) 0(iP) = {Л-,Л, Ч,...,4,}. 1 йк т, то множество S 0(LP) смешанных стратегий, оптимальных по критерию Лапласа относительно выигрышей, есть симплекс размерности k- с к вершинами, изображающими оптимальные чистые стратегии А^,А и,...,А^.

Следствие 2.7.2. Если каждая чистая стратегия является оптимальной по критерию Лапласа относительно выигрышей, то и каждая смешанная стратегия также оптимальна по тому же критерию.

Следствие 2.7.3. Если среди чистых стратегий оптимальной по критерию Лапласа относительно выигрышей является только одна, то во множестве смешанных стратегий других оптимальных по этому же критерию стратегий нет.

Следствие 2.7.4. Если не все чистые стратегии являются оптимальными по критерию Лапласа относительно выигрышей, то множество S if) смешанных стратегий, оптимальных по тому же критерию, принадлежит границе Fr 5 симплекса S.

Пример 2.7.1. Рассмотрим игру с природой из примера 2.6.1, в которой т = 4, а п = 5. Из матрицы выигрышей (2.6.20) найдем по формуле (2.7.1) И" - показатели эффективности чистых стратегий:!{" = 0,2(2 + 7 + 3 + 15 + 6) = 6,6, 1!’ г =0,2 (4 +6 + 11 + 3 + 5) = 5,8, =0,2 (6+ +4 + 9 + 10 + 5) = 6,8, =0,2-(3 + 8 + 7 +

9+ 5) = 6,4. Отсюда делаем вывод, что единственной чистой If -оптимальной является стратегия А 3 .

Сравнивая полученный результат с результатом решения примера 2.6.1, видим, что по критерию Байеса относительно рисков с вектором вероятностей состояний природы «у = (0,30; 0,20; 0,15; 0,10; 0,25) и критерию Лапласа относительно вышрышей оптимальными являются разные стратегии?

Вопросы для самоконтроля знаний

  • 1. В чём состоит принцип Лапласа недостаточного основания?
  • 2. Покажите, что вектор вероятностей состояний природы в критерии Лапласа обладает всеми свойствами вектора вероятностей состояний природы в общем случае.
  • 3. Дайте определение показателю эффективности чистой стратегии по критерию Лапласа относительно выигрышей.
  • 4. Что такое цена игры в чистых стратегиях по критерию Лапласа относительно выигрышей?
  • 5. Какая стратегия называется оптимальной во множестве чистых стратегий по критерию Лапласа относительно выигрышей?
  • 6. Определите критерий Лапласа оптимальности смешанных стратегий относительно выигрышей.
  • 7. Каковы границы изменения показателя эффективности чистой стратегии?
  • 8. Каковы границы изменения цены игры?
  • 9. Какова связь между показателем эффективности смешанной стратегии и показателями эффективности чистых стратегий?
  • 10. Существуют ли игры с природой, в которых цена игры в чистых стратегиях отлична от цены игры в смешанных стратегиях?
  • 11. Дайте геометрическую интерпретацию множеству стратегий, оптимальных во множестве смешанных стратегий по критерию Лапласа относительно выигрышей.
  • 12. Что можно сказать о множестве стратегий, оптимальных во множестве смешанных стратегий по критерию Лапласа относительно выигрышей, если каждая чистая стратегия оптимальна?
  • 13. Что можно сказать о множестве стратегий, оптимальных во множестве смешанных стратегий по критерию Лапласа относительно выигрышей, если среди чистых стратегий только одна является оптимальной?
  • 14. Дайте определение границы множества в конечномерном евклидовом пространстве.

Задачи для самостоятельного решения

2.7.1. (Реализация химического реактива). Пусть в условиях задачи 2.1.5 состояния спроса на 11, 12 и 13 ящиков реактива ВС-6 в неделю равновероятны. По значениям выигрыш-функции (см. ответ к задаче 2.1.5) сформировать матрицу выигрышей.

Сколько ящиков реактива надо производить, чтобы среднеарифметическая прибыль была наибольшей?

Определить, при какой из смешанных стратегий Р" = (0,1; 0,5; 0,4) и Р" = (0,4; 0,5; 0,1) производства реактива ЗАО «Фото и цвет» получит большую среднеарифметическую прибыль?

  • 2.7.2. (Планирование посева). Будем считать, что в условиях задачи 2.5.3 сухая, нормальная и влажная погода наступают с одинаковой вероятностью. Какую культуру посеять с тем, чтобы доход был наибольшим. Полученное решение сравнить с решением задачи 2.5.3.
  • 2.7.3. Пусть игра с природой задастся платежной матрицей

Найти полное решение по выигрыш-критерию Лаиаласа. Для каждой чистой стратегии и цены игры в чистых стратегиях проиллюстрировать справедливость соответственно неравенств (2.7.4) и (2.7.5).

  • 2.7.4. В условиях задачи 2.7.3 проверить на оптимальность смешанную стратегию Р° =(0,25; 0,00; 0,75). Если стратегия Р° = (0,25; 0,00; 0,75) оптимальна, то показать выполнимость для нес равенства (2.7.9). Для смешанной стратегии Р = (0,15; 0,55; 0,30) проиллюстрировать справедливость равенства (2.7.10) и неравенств (2.7.11).
  • 2.7.5. (Выпуск новой продукции). Предположим, что в условиях задачи
  • 2.4.5 состояния спроса равновероятны. Найти полное решение по выигрыш- критерию Лапласа и дать ему экономическую интерпретацию.
  • Пьер Симон Лаплас (фр. Pierre-Simon tie Laplace) - выдающийся французский математик, физик и ас-троном, родился в Бомон-ан-Ож (Нормандия) 23 марта 1749 года в небогатой крестьянской семье. Рано проявиввыдающиеся способности, с блеском окончил в Бомон-ан-Ож школу монашеского ордена бенедиктинцев, из которой вышел, между прочим, убеждённым атеистом, и был оставлен там же в Бомоне, преподавателем математики ввоенной школе. Первую научную работу написал в 17 лет, т.е. в 1766 г., и в этом же году отправился в Париж, гдес помощью Д"Аламбера получил место преподавателя в Военной школе Парижа. Важнейшие направления научныхисследований Лапласа - математика, математическая физика, астрономия. Лаплас - один из основателей математической теории вероятностей. Получил фундаментальные результаты по интегрированию дифференциальныхуравнений в частных производных, ввел в рассмотрение производящие функции и «преобразование Лапласа», доказал биномиальный закон распределения вероятностей и первые предельные теоремы теории вероятностей. Завершил создание небесной механики. Ему принадлежат основополагающие результаты по теории устойчивостиСолнечной системы, движений Юпитера и Сатурна («законы Лапласа»), приливов и отливов, космогоническойгипотезы И. Канта («гипотеза Канта-Лапласа»), ускорения движения Луны и сжатия Земли (1787), скорости распространения звука в воздухе и плотности воздуха (1809). Лаплас - адъюнкт Французской АН (1773), профессорПарижской артиллерийской школы (1775), а затем экзаменатор Артиллерийского корпуса, председатель Палатымер и весов (1790), член Национального института (с 1795), руководитель Бюро Долгот (1795), после ВеликойФранцузской революции активно участвовал в реорганизации системы образования во Франции и в созданииВысшей нормальной и Политехнической школ. Лаплас - действительный член Парижской АП (1785), член Королевских обществ в Турине и Копенгагене (1801), член Академий наук в Гёттингене (1802), Берлине (1808), Голландии (1809), Почетный член Петербургской АП (с 1802). Во время Консулата был назначен Наполеоном министромвнутренних дел Франции, затем - вице-президентом сената (1803) и через месяц - канцлером; награжден орденом Почетного легиона (1804). В 1811 г. Наполеон присвоил ему звание графа де Лаплас, за что ученый посвятилимператору третий том своего «Трактата о небесной механике». Говорят, что на вопрос Наполеона, почему в егоТрактате нет упоминания о боге, Лаплас ответил: «Ваше величество, эта гипотеза оказалась не нужной». Послереставрации монархии Лаплас пользовался благосклонностью Людовика XVIII, который сделал его пэром Франции и пожаловал титул маркиза. В 1817 г. Лаплас стал членом вновь созданной Французской академии, т.е. - одним из сорока бессмертных. Лаплас был широко образованным человеком. По своим философским взглядам склонялся к материализму. Он знал языки, историю, философию, химию, биологию. Любил поэзию, музыку, живопись.Семейная жизнь Лапласа протекла ровно и приятно. Был женат (1778) на Шарлоте де Курти - красивой женщинес мягким, добрым характером, которая любила своего мужа, преклонялась перед ним и делала все, чтобы оградитьего от домашних забот и волнений, чтобы все свое время он мог посвящать занятиям наукой. Подарила ему дочь исына. Умер ученый 5 марта 1827 г. после недолгой болезни. Его последние слова были: «То, что мы знаем, такничтожно по сравнению с тем, что мы не знаем». (, [ 18], , ).
  • 2. Этапы процесса принятия рационального управленческого решения
  • 3. Методы оптимизации решений
  • Лекция 3 Стратегические решения
  • 1. Стратегическое управление, основные принципы стратегического управления
  • 2.Технология выработки стратегических решений
  • Стратегические интересы, лежащие в основе выработки стратегии организации
  • 3. Классификация стратегий
  • Лекция 4 Системный подход в процессе разработки управленческих решений
  • 1. Понятие системного подхода, его основные черты и принципы.
  • 2. Значение системного подхода в управлении
  • 3. Системный подход при принятии управленческих решений, системный анализ
  • Лекция 5 Ситуационный анализ в процессе разработки управленческих решений
  • 1. Ситуационный подход в управлении
  • 2. Этапы ситуационного анализа
  • 3.Методы сиуационного анализа
  • Лекция 6 Целевая ориентация управленческих решений
  • 1. Целеполагание при выборе управленческого решения
  • 2. Оценивание целей
  • 3. Инициативно-целевая технология
  • 4. Программно-целевая технология
  • 5.Регламентная технология
  • Лекция 7 Процессорные технологии принятия управленческих решений
  • 1. Управление по результатам
  • 2. Управление на базе потребностей и интересов
  • 3.Управление путем постоянных проверок и указаний
  • Лекция 8 Информация для принятия управленческих решений
  • 1. Роль информации в процессе принятия решения
  • 2. Сущность информационных систем и подходы к их разработке
  • 3. Автоматизированная система поддержки управленческих решений
  • Лекция 9 Методы анализа и прогнозирования управленческих решений
  • 1. Понятие анализа, классификация методов анализа
  • 2. Приемы анализа
  • 3. Понятие прогнозирования и его задачи
  • 4. Виды прогнозов, классификация прогнозов
  • 5. Классификация основных методов прогнозирования
  • Лекция 10 Принятие управленческих решений в условиях определенности
  • 1. Постановка задачи обоснования решений в условиях определенности, основные этапы разработки решений в условиях определенности.
  • Лекция 11 Принятие управленческих решений в условиях неопределенности
  • 2. Методы и технологии принятия решений в условиях «природной» неопределенности
  • 3. Критерий Лапласа, Вальда, Сэвиджа, Гурвица
  • Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.
  • 4. Метод теории игр при принятии решений в условиях неопределенности
  • Лекция 12 Принятие управленческих решений в условиях риска
  • 1. Риск и его разновидности
  • 2.Управления рисками, способы оценки рисков
  • 3. Критерии принятия решения в условиях риска
  • 4. Дерево решений как метод принятия управленческих решений в условиях риска
  • Лекция 13 Моделирование процесса разработки управленческого решения
  • 1. Понятие и виды моделей
  • 2. Модели процесса разработки управленческого решения
  • 3. Специальные модели принятия решений
  • Лекция 14 Количественные экспертные оценки в процессе разработки управленческих решений
  • 1. Сущность метода экспертных оценок и его область применения
  • 2. Количественные экспертные оценки, их методы
  • 3. Шкалы количественных экспертных измерений
  • Лекция 15 Качественные экспертные оценки в процессе разработки управленческих решений
  • 1. Качественные экспертные оценки, их методы
  • 2.Коллективные методы экспертных оценок
  • Шкалы качественных измерений:
  • Лекция 16 Качество и эффективность управленческих решений
  • 1.Качество управленческих решений
  • 2. Эффективность управленческих решений
  • 2. Методы оценки эффективности управленческих решений
  • Лекция 17 Реализация и контроль выполнения управленческих решений
  • 1. Сущность и виды контроля реализации управленческих решений
  • 2.Процесс контроля реализации управленческих решений
  • 3. Инструменты и характеристики эффективного контроля реализации управленческих решений
  • Лекция 18 Управленческие решения и ответственность руководителей за ур
  • 1.Понятие ответственности за результаты принятия и исполнения управленческого решения.
  • 2. Социальная ответственность руководителя
  • 3. Типы менеджмента и алгоритмы принятия решений.
  • Рекомендуемая литература для самостоятельной работы студентов
  • Словарь понятий
  • 3. Критерий Лапласа, Вальда, Сэвиджа, Гурвица

    Существует несколько критериев для выбора оптимальной стратегии при принятии решения в условиях риска и неопределенности.

    Критерий Лапласа: применяется, если можно предполагать, что все варианты внешних условий одинаково вероятны. Для каждого решения находится средняя оценка по всем вариантам внешних условий (средний выигрыш):

    где N– количество состояний внешней среды.

    где Z – оптимальная стратегия.

    Критерий Вальда: (критерий крайнего пессимизма, максиминный критерий): решение выбирается в расчете на наихудшие внешние условия. Вероятности состояний природы неизвестны и нет возможности получить о них какую-либо статистическую информацию. В качестве оценки каждого решения используется минимальный выигрыш, который можно получить при выборе этого решения:

    Лучшим является решение с максимальной оценкой.

    Лучшим является решение с максимальной оценкой.

    По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния природы.

    Критерий Сэвиджа, как и критерий Вальда, - это критерий крайнего пессимизма, но только пессимизм здесь проявляется в том, что минимизируется максимальная поте­ря в выигрыше. Для оценки решений используется матрица рисков. В качестве оценки используется максимальный риск (максимальный потерянный выигрыш), соответствующий данному решению:

    Лучшим является решение с минимальной оценкой.

    Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.

    Критерий Гурвица: решение принимается с учетом того, что возможны как благоприятные, так и неблагоприятные внешние условия. При использовании этого критерия требуется указать «коэффициент пессимизма» – число в диапазоне от 0 до 1, представляющее собой субъективную (т.е. не рассчитанную, а указанную человеком) оценку возможности неблагоприятных внешних условий. Если есть основания предполагать, что внешние условия будут неблагоприятными, то коэффициент пессимизма назначается близким к единице. Если неблагоприятные внешние условия маловероятны, то используется коэффициент пессимизма, близкий к нулю. Оценки решений находятся по следующей формуле:

    где a – коэффициент пессимизма.

    Лучшим является решение с максимальной оценкой:

    Кроме критериев оптимальности, которые можно применять при принятии решения в условиях риска и неопределенности, существует очень известный и распространенный метод теории игр, используемый в управленческой деятельности в условиях неопределенности.

    4. Метод теории игр при принятии решений в условиях неопределенности

    При принятии решений в условиях неопределенности очень широко используется метод теории игр. Теория игр – это математическая теория конфликтных ситуаций. Задача этой теоpии – выработка рекомендаций по рациональному образу действий участников конфликта. При этом строят упрошенную модель конфликтной ситуации, называемую игрой. Под «игрой» понимают мероприятие, состоящее из ряда действий или «ходов». От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Сторо­ны, участвующие в конфликте, называют игроками, исход конфликта - выигрышем и т.д.

    Если в игре сталкиваются интересы двух сторон, то игра называется парной, если сторон больше - множествен­ной. Множественная игра с двумя постоянными коалициями обращает игру в парную. Наибольшее практическое значе­ние имеют парные игры. Рассматрим конечную игру, в которой игрок А имеет m стратегий, а игрок В - n стратегий. Та­кая игра называется m x n. Стратегии, соответственно, обозначим: А 1 , А 2 , ..., А m - для игрока А; В 1 , В 2 , ..., В n - для игрока В. Если игра состоит только из личных ходов, то выбор стратегий А i и В j игроками однозначно определяет исход игры - наш выигрыш a ij Если известны a ij для всех сочетаний стратегий, то они образуют платежную матрицу размером m x п, где: m - число строк матрицы, а n - число его столбцов.

    Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной и минимаксной), является в теории игр основным принципом и называется принципом минимакса. В платежной матрице такой игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент назы­вают седловой тонкой. При этом значение v=ą=þ назы­вают чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством: если один из игроков придерживает­ся своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной страте­гии . Если верхняя цена игры не совпадает с нижней, то в этом случае стоит говорить об игре в смешанных стратегиях. Смешанной S A называется применение чистых стратегий А 1 ,А 2 ,…,А n с вероятностью p 1 ,p 2 ,…,p n , а смешанной стратегией S B - применение чистых стратегий B 1 ,B 2 ,…,B n с вероятностью p 1 ,p 2 ,…,p m . Пусть игра имеет размерность 2 на 2 и задается платежной матрицей:

    Для игрока А оптимальная стратегия будет иметь вероятности:

    ;
    ; цена игры

    Краткая теория

    Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

    Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

    Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

    Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

    В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

    В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

    Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

    Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

    Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

    Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

    После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

    Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

    Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

    Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

    С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

    Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

    Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

    Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

    В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

    Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

    где риск .

    Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

    Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

    Пример решения задачи

    Условие задачи

    После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

    1. требуется профилактический ремонт;
    2. требуется замена отдельных деталей и узлов;
    3. требуется капитальный ремонт.

    В зависимости от ситуации руководство предприятия может принять следующие решения:

    Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

    a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

    Решение задачи

    Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по методам оптимальных решений с контрольными или экзаменами.

    Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

    Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

    Стратегия руководства:

    Отремонтировать оборудование своими силами

    Вызвать бригаду специалистов

    Заменить оборудование новым

    Стратегия природы - 3 возможных состояния оборудования.

    Требуется профилактический ремонт;

    Следует заменить отдельные детали и узлы;

    Требуется капитальный ремонт.

    Расчет платежной матрицы и матрицы рисков

    Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

    -4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

    Составляем матрицу рисков:

    -4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

    Критерий Байеса

    Определяем средние выигрыши:

    По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

    Критерий Лапласа

    Определим средние выигрыши:

    По критерию Лапласа оптимальной является стратегия - вызвать бригаду специалистов

    Критерий Вальда

    По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

    Критерий Сэвиджа

    По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

    Критерий Гурвица

    По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

    Ответ

    По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».


    Содержит изложенные в краткой и доступной форме теоретические сведения о матричной игре без седловой точки и способе сведения такой задачи к задаче линейного программирования, для отыскания ее решения в смешанных стратегиях. Приведен пример решения задачи.

    Многоканальная СМО с неограниченной очередью
    Приведены необходимые теоретические сведения и образец решения задачи по теме "Многоканальная система массового обслуживания с неограниченной очередью", подробно рассмотрены показатели многоканальной системы массового обслуживания (СМО) с ожиданием обслуживания - среднее число каналов, занятых обслуживанием заявки, длина очереди, вероятность образования очереди, вероятность свободного состояния системы, среднее время ожидания в очереди.

    Критический путь, критическое время и другие параметры сетевого графика работ
    На примере решения задачи рассмотрены вопросы построения сетевого графика работ, нахождение критического пути и критического времени. Также показано вычисление параметров и резервов событий и работ - ранних и поздних сроков, общих (полных) и частных резервов.

    Этот критерий опирается на известный принцип недостаточного обоснования. Поскольку вероятности состояний q 1 , q 2 , ... ,q n не известны, необходимая информация для вывода, что эти вероятности различны, отсутствует. В противном случае можно было бы определить эти вероятности и ситуацию уже не следовало рассматривать как принятие решения в условиях неопределенности. Так как принцип недостаточного обоснования утверждает противоположное, то состояния q 1 , q 2 , ... ,q n имеют равные вероятности. Если согласиться с приведенными доводами, то исходную задачу можно рассматривать как задачу принятия решений в условиях риска, когда выбирается действие a i , дающее ожидаемый выигрыш.

    Другими словами, находится действие a i * , соответствующее

    Вероятность реализации состояния q j (j =1,2, ... ,n),

    Пример. Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов в течение предстоящих праздников. Точное число клиентов не известно, но ожидается, что оно может принять одно из четырех значений: 200, 250, 300 или 350 клиентов. Для каждого из этих возможных значений существует наилучший уровень предложения (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения предложения над спросом, либо из-за неполного удовлетворения спроса.


    12. Минимаксный критерий

    Является наиболее осторожным, поскольку основывается на выборе наилучшей из наихудших возможностей. Если результат n (a i , q j) представляет потери лица, принимающего решение, для действия a i наибольшие потери независимо от возможного состояния q j будут равны

    В этом случае критерий называется максиминным.

    Подходы к учету неопределенности при описании рисков. В теории принятия решений в настоящее время при компьютерном и математическом моделировании для описания неопределенностей чаще всего используют такие математические средства, как: вероятностно-статистические методы, методы статистики нечисловых данных, в том числе интервальной статистики и интервальной математики, а также методы теории нечеткости, - методы теории конфликтов (теории игр). Они применяются в имитационных, эконометрических, экономико-математических моделях, реализованных обычно в виде программных продуктов. Некоторые виды неопределенностей связаны с безразличными к организации силами - природными (погодные условия) или общественными (смена правительства). Если явление достаточно часто повторяется, то его естественно описывать в вероятностных терминах. Так, прогноз урожайности зерновых вполне естественно вести в вероятностных терминах. Если событие единично, то вероятностное описание вызывает внутренний протест, поскольку частотная интерпретация вероятности невозможна. Так, для описания неопределенности, связанной с исходами выборов или со сменой правительства, лучше использовать методы теории нечеткости, в частности, интервальной математики (интервал – удобный частный случай описания нечеткого множества). Наконец, если неопределенность связана с активными действиями соперников или партнеров, целесообразно применять методы анализа конфликтных ситуаций, т.е. методы теории игр, прежде всего антагонистических игр, но иногда полезны и более новые методы кооперативных игр, нацеленных на получение устойчивого компромисса. Иногда под уменьшением риска понимают уменьшение дисперсии случайной величины, поскольку при этом уменьшается неопределенность. В теории принятия решений риск - это плата за принятие решения, отличного от оптимального, он обычно выражается как математическое ожидание. В экономике плата измеряется обычно в денежных единицах, т.е. в виде финансового потока (потока платежей и поступлений) в условиях неопределенности.
    13.Критерий Сэвиджа

    Критерий Сэвиджа стремится смягчить консерватизм минимаксного (максиминного) критерия путем замены матрицы платежей (выигрышей или проигрышей) v(а i , s j) матрицей потерь r(а i , s j), которая определяется следующим образом.

    По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

    При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

    Для решения задачи строится так называемая “матрица рисков”, элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения.

    Этот критерий опирается на «принцип недостаточного основания» Лапласа, согласно которому все состояния «природы» Si, i = 1,n полагаются равновероятными. В соответствии с этим прин­ципом каждому состоянию Si, ставится вероятность q i определяе­мая по формуле

    При этом исходной может рассматриваться задача принятия решения в условиях риска, когда выбирается действие R j , дающее наибольший ожидаемый выигрыш. Для принятия решения для каж­дого действия R j вычисляют среднее арифметическое значение вы­игрыша:

    Среди Mj(R) выбирают максимальное значение, которое будет соответствовать оптимальной стратегии R j .

    Другими словами, находится действие Rj , соответствующее

    Если в исходной задаче матрица возможных результатов пред­ставлена матрицей рисков ||r ji ||, то критерий Лапласа принимает следующий вид:

    Пример 4. Одно из транспортных предприятий должно опре­делить уровень своих провозных возможностей так, чтобы удовле­творить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги не известен, но ожидается (прогнозируется), что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует на­илучший уровень провозных возможностей транспортного пред­приятия (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превы­шения провозных возможностей над спросом (из-за простоя по­движного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Ниже приводится таблица, определяющая возможные прогнозируемые затраты на развитие провозных воз­можностей:

    Таблица 10- прогнозируемые затраты на развитие провозных воз­можностей

    Варианты провозных возможностей транспортного предприятия

    Варианты спроса на транспортные

    Необходимо выбрать оптимальную стратегию.

    Согласно условию задачи, имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: S 1 , S 2 , S 3 , S 4 . Известны также четыре стратегии разви­тия провозных возможностей транспортного предприятия: R 1 , R 2 , R 3 , R 4 Затраты на развитие провозных возможностей при каждой паре S i и R j заданы следующей матрицей (таблицей):

    Рисунок 4-матрица для принятия решения

    Принцип Лапласа предполагает, что S 1 , S 2 , S 3 , S 4 равновероят­ны. Следовательно, P{S = S i }= 1/n= 1/4 = 0,25, i = 1, 2, 3, 4 и ожидае­мые затраты при различных действиях R 1 , R 2 , R 3 , R 4 составляют:

    Таким образом, наилучшей стратегией развития провозных воз­можностей в соответствии с критерием Лапласа будет R 2 .

    2. Критерий Вальда (минимаксный или максиминный крите­рий).

    Применение данного критерия не требует знания вероятнос­тей состояний Si. Этот критерий опирается на принцип наиболь­шей осторожности, поскольку он основывается на выборе наилуч­шей из наихудших стратегий Rj.

    Если в исходной матрице (по условию задачи) результат V ij представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии R j необходимо в каждой строке матрицы результатов найти наибольший элемент max{V ij }, а затем выбирается действие R j (строка j), которому будет соответствовать наименьший элемент из этих наибольших элементов, т. е. дейст­вие, определяющее результат, равный

    . (29)

    Если в исходной матрице по условию задачи результат V ij пред­ставляет выигрыш (полезность) лица, принимающего решение, то при выборе оптимальной стратегии используется максиминный кри­терий.

    Для определения оптимальной стратегии R j в каждой строке матрицы результатов находят наименьший элемент min {Vij} , а затем выбирается действие R j (строка j), которому будут соответство­вать наибольшие элементы из этих наименьших элементов, т. е. действие, определяющее результат, равный

    Пример 5. Рассмотрим пример 4. Так как V ij в этом примере представляет потери (затраты), применим минимаксный критерий. Необходимые результаты вычисления приведены в следующей таб­лице:

    Таблица 11-

    Таким образом, наилучшей стратегией развития провозных воз­можностей в соответствии с минимаксным критерием «лучшим из худших» будет третья, т. е. R 3 .

    Минимаксный критерий Вальда иногда приводит к нелогич­ным выводам из-за своей чрезмерной «пессимистичности». «Пес­симистичность» этого критерия исправляет критерий Сэвиджа.