Информационный портал  "TRANSFORMаторы"

Выбор решений и безопасность

Г.В.Попов



Рассмотрены теоретические проблемы принятия решений в различных областях человеческой деятельности. Особый акцент делается на обоснование выбора в экстремальных ситуациях. Предназначено для студентов специальности 330100 "Безопасность жизнедеятельности в техносфере" в рамках дисциплины "Теория системного анализа и принятия решений".

Может быть полезно студентам других специальностей при изучении аналогичной дисциплины, а также инженерно-техническим работникам при решении практических проблем, связанных с выбором конкретного варианта действий.

Введение

За блага техногенной цивилизации, с которыми человечество вступило в XXI век, к сожалению, приходится расплачиваться. Плата эта в ряде случаев оказывается предельно высокой. Речь идет о жизни конкретных людей. В большинстве же случаев происходит деградация среды, окружающей технический объект, в котором случилась авария или катастрофа. В результате — потеря материальных ценностей, раз-рушение природной среды, стрессы и ухудшение здоровья людей, что в итоге приводит к сокращению их продолжительности жизни.

В негативном функционировании техногенных объектов часто повинен сам человек, допустивший при управлении этим объектом какую-то ошибку или неточность. Это так называемый человеческий фактор, о котором сейчас много говорят.

Как уменьшить количество ошибочных и неточных действий людей в разных ситуациях, в повседневной жизни и особенно на производстве. Понятно — их нужно учить. Учить очень многому: и как управлять объектом, и какие действия предпринимать в разнообразных нештатных ситуациях, и как защитить себя и товарищей от последствий отказов и аварий, и т.д.

Оказывается, есть метанаука над этими конкретными знаниями, которая позволяет понять общие подходы к нахождению лучших или по крайней мере неошибочных действий человека в разнообразных ситуациях. Эта наука называется теорией принятия решений. Конечно, в обыденной жизни пользоваться формальными методами принятия решений не всегда оправданно (хотя и здесь они не должны полностью игнорироваться). Однако, если иметь в виду производственную деятельность, то там современный специалист должен опираться на научные подходы. Особенно это касается сложных ситуаций, когда последствия неэффективного решения могут носить достаточно драматичный характер, т.е. затрагивать здоровье и жизнь людей, наносить ущерб материальным ценностям и окружающей среде.

В рамках данного пособия автор остановился только на некоторых вопросах, связанных с проблематикой выбора, предполагая, что заинтересованный читатель будет углублять свои знания и дальше, используя источники, приведенные в списке литературы, а также те многочисленные публикации, которые в настоящее время появляются по данной проблеме.

1. Основные положения

1.1. Общее представление о системном анализе

Системный анализ (СА) — это научная стратегия достижения результата при решении сложных проблем, предполагающая комплексный учет всех основных факторов, эту проблему обусловливающих. При СА правомерно использование тех математических методов и моделей, которые позволяют получать приемлемый для практических целей результат.

В связи с активизацией кризисных процессов в окружающем нас мире возможности современной науки не всегда соответствуют сложности возникающих проблем. В таких случаях даже стратегия научного анализа на основе СА оказывается в состоянии дать весьма приближенный, порой чисто качественный, результат.

СА широко применяется в различных областях знаний. Для такой предметной области, как безопасность жизнедеятельности, применение СА особенно оправданно в связи со сложностью рассматриваемых процессов, в которых фокусируются действия людей, работа сложной техники, влияние внешней среды. Если учесть, что каждая составляющая этих процессов постоянно увеличивает амплитуду своих колебаний, то становятся понятными причины разнообразных негативных явлений (аварий, катастроф, стихийных бедствий и т.п.), частота которых заметно нарастает. Это отмечают многие известные ученые в своих трудах, в частности, наши современники — И.Р. Пригожин, Д.Н. Панин и др.

Бесперспективность попыток объяснения окружающего нас мира с чисто научных позиций заметили еще в древности. Так, в Экклезиасте сказано: "Кто умножает знание, тот увеличивает скорбь", а швейцарский психоаналитик Карл Юнг (1875–1961 гг.), выдающийся мыслитель и философ, утверждал: "Мы богатеем познаниями и беднеем мудростью".

Таким образом, несмотря на все научные достижения, уменьшения негативных тенденций в окружающем нас мире не наблюдается, а все больше и больше ученых как у нас в стране, так и за рубежом предсказывают в не столь отдаленном будущем целую череду еще более острых кризисных явлений. Поэтому есть основание говорить о необходимости, хотя бы в такой предметной области, как безопасность жизнедеятельности, результаты СА подвергать осмыслению в рамках нравственной парадигмы, носителями которой являются религия, культура, традиции и т.д.

Обычно СА организуется в виде последовательности следующих этапов:

  • постановка задачи и ограничение степени ее сложности;
  • выбор целей и их ранжирование;
  • выбор способов решения задачи;
  • моделирование;
  • оценка получаемых результатов и их практическое использование.
  • 1.2. Понятие процесса принятия решения

    Процесс принятия решения (ППР) — это особый вид человеческой деятельности, состоящий в выборе одного конкретного способа действий из нескольких возможных.

    В течение всей жизни человек постоянно принимает решения. Возможность это делать – отличительная особенность людей от других живых существ, благодаря чему человек может достигать огромных "степеней свободы", что, к сожалению, часто используется им не во благо.

    Центральным в ППР является понятие выбора. Способность сделать правильный выбор — очень ценное качество, присущее людям в разной степени. Объяснить, что такое правильный выбор непросто. Легче сказать, что такое неправильный выбор. Это действия человека, приводящие к несчастным случаям, авариям, катастрофам и другим, неприятным для людей и окружающей среды, последствиям. Каждый может привести примеры подобных решений из своей личной жизни, поступков знакомых людей, сообщений прессы и т.д.

    Правильный выбор и соответственно правильное решение в дальнейшем будем рассматривать как действие, направленное на достижение наибольшего блага или наименьшего вреда для данного человека или производственного коллектива в конкретной ситуации.

    СА и теория ПР — это отдельная наука, которая взаимосвязана со многими другими. На рис. 1 указаны базовые для СА научные теории.

    Информатика — наука, изучающая общие свойства информации, а также проблемы, связанные с ее сбором, хранением, поиском, переработкой, преобразованием, распространением и использованием в различных сферах деятельности.

    Кибернетика — наука об общих законах управления сложными системами.

    Рис. 1. Связь теории системного анализа и принятия решений с другими науками

    Искусственный интеллект — область знаний, ставящая своей задачей создание технического интеллекта, не уступающего человеческому.

    Психология — наука, изучающая процессы и закономерности психической деятельности человека.

    Для всех ППР общим является:

    1. Неполная информация, которая обусловливает неясные последствия ПР.

    2. Множество факторов, которые необходимо принимать во внимание при ПР.

    3. Любое решение содержит элемент субъективности, т.е. личностную составляющую лица, принимающего решение (ЛПР).

    1.3. Примеры принятия решений

    Как уже отмечалось, любая деятельность человека связана с ПР. Часто, несмотря на свою обыденность, принимаемое в данный момент решение может оказать определяющее влияние на длительный период или даже на всю последующую жизнь человека.

    Каждому взрослому человеку практически ежедневно не один раз приходится переходить проезжую часть, по которой перемещаются большие потоки автотранспорта. В такие моменты любой пешеход подвергается опасности. К сожалению, ошибки в ПР с его стороны или со стороны водителя (иногда ошибки являются двухсторонними) не-редко заканчиваются трагическим исходом.

    Еще большие проблемы возникают, когда принимать решения человеку приходится в условиях стресса, который может быть обусловлен дефицитом времени, недостатком информации, высокой ответственностью за ПР и другими причинами. Такие ситуации возникают, например, на пульте управления сложным технологическим процессом, когда оператор замечает существенные отклонения от заданных параметров, что может предшествовать аварии. Еще более серьезным испытаниям подвергается космонавт при работе на орбитальной станции во время выхода в открытый космос. Высокую ответственность за принимаемые решения несет диспетчер службы спасения, сталкиваясь с необычной ситуацией, врач-хирург, выполняя нетрадиционную операцию и т.д.

    Любой специалист и особенно специалист по БЖД должен осознавать, что в своей практической деятельности ситуации, связанные с ответственным выбором, возникать будут неизбежно. Поэтому готовить себя к подобным событиям необходимо заранее. На эти цели направлено изучение теории ПР, практические занятия, психологические тренировки.

    В производственной практике специалиста по БЖД, как правило, многие проблемы для их правильного решения требуют применения соответствующих моделей и компьютерных программ. Уметь квалифицированно использовать в нужный момент соответствующие теоретические знания и программные средства поддержки ПР — задача исключительной важности.

    1.4. Участники процесса принятия решения

    В задачах ПР сама проблема выбора тесно связана с человеком — ее владельцем. Владельцем проблемы является человек, который должен ее решать и нести ответственность за принятые решения. Но не всегда владелец проблемы является также и ЛПР, хотя известны многочисленные примеры совмещения этих двух ролей — ЛПР и владельца проблемы [1].

    На принятие решений в той или иной степени влияют активные группы — сообщества людей, имеющих общие интересы по отношению к проблеме, требующей решения. Так, при принятии решения о постройке атомной электростанции (АЭС) активными группами являются:

  • сотрудники Министерства энергетики, заинтересованные в приросте электроэнергии;
  • работники организации, осуществляющей постройку АЭС;
  • представители рядовых граждан;
  • представители защитников окружающей среды.
  • В данном случае владельцем проблемы (и иногда ЛПР) являются местные власти, которые должны дать разрешение на постройку АЭС на своей территории.

    При ПР важную роль играют эксперты — люди, которые профессионально (лучше, чем ЛПР) знают отдельные аспекты рассматриваемой проблемы. К ним обычно обращаются за оценками, за прогнозами исходов тех или иных решений. Давая такие оценки, эксперты высказывают свое субъективное мнение.

    Так, при ПР о постройке АЭС эксперты-физики могут дать ценные сведения о влиянии АЭС на людей и окружающую среду. Они могут произвести расчеты вероятности аварий на АЭС и их возможных последствиях. Но следует помнить, что само решение принимает ЛПР, а эксперты дают лишь часть необходимой информации.

    При принятии сложных (стратегических) решений в их подготовке принимают участие консультанты по ПР. Их роль сводится к эффективной организации самого процесса ПР.

    Итак, люди, участвующие в решении проблемы, могут играть одну из следующих ролей:

    1) владелец проблемы;

    2) ЛПР;

    3) представитель активной группы;

    4) эксперт;

    5) консультант.

    Ответственность за выбор решения может быть односторонней (индивидуальной) или многосторонней (групповой).


    1.5. Альтернативы

    Альтернативами называют варианты возможных решений. Для существования самой задачи ПР необходимо иметь хотя бы два варианта, поскольку только в этом случае может быть реализован выбор.

    Множество альтернатив может быть дискретным (конечным) или непрерывным (континуальным). Альтернативы бывают независимыми и зависимыми. Независимыми являются те альтернативы, любые действия с которыми (удаление из рассмотрения, выделение в качестве лучшей и т.п.) не оказывают влияния на качество других альтернатив. При зависимых альтернативах решения по одним оказывают влияние на качество других.

    Задачи ПР могут существенно отличаться также по числу альтернатив и их наличию на момент ПР. Встречаются задачи, когда все альтернативы уже заданы и необходим лишь выбор из этого множества. Особенностью этих задач является замкнутое и нерасширяющееся множество альтернатив. Но существуют задачи другого типа, в которых альтернативы не сформированы на момент ПР, а генерируются в процессе принятия решений.

    Итак, альтернативы, присутствующие в задачах ПР, могут быть следующими:

    1) независимыми или зависимыми;

    2) заранее заданными или конструируемыми в ППР.

    Среди набора альтернатив в некоторых задачах ПР обязательно должна присутствовать так называемая нулевая альтернатива, под которой понимается вариант "не делать ничего". В отдельных ситуациях, не носящих стратегического характера, именно такой выбор оказывается наилучшим.

    При графической интерпретации задач ПР альтернативы обычно откладываются по оси Х.

    1.6. Цели и критерии

    Цель — это антипод проблемы [4]. При формулировании проблемы определяется нечто, требующее своего изменения. Например, на некотором предприятии имеет место высокий уровень травматизма. Другой пример — на автодорожной трассе существует участок, где количество ДТП значительно превосходит средний уровень.

    Говоря о цели, пытаются определить направление изменения ситуации, которая нас не устраивает. Понятно, что способов решения любой проблемы может быть много. В сложных ситуациях сразу поставить правильную цель бывает достаточно трудно, поэтому в процессе СА цель может и должна уточняться.

    На выработку цели ЛПР оказывает влияние его общая идеология, система ценностей, которой он придерживается.

    В последнее время среди специалистов много споров идет о двух альтернативных системах ценностей (табл. 1).

    Особый крен в сторону одних или других ценностей вряд ли оправдан. В повседневной деятельности целесообразен разумный компромисс для возможности выработки взвешенного и эффективного решения. Здесь важно мыслить системно, не ограничиваясь только узкими рамками собственной предметной области. Примером подобной ситуации является шуточное высказывание, которое встречается у врачей-хирургов: "Операция прошла успешно, но пациент умер".

    Т а б л и ц а 1

    Альтернативные системы ценностей

    Технократическая система ценностей Гуманистическая система ценностей
    Природа как источник неограниченных ресурсов Природные ресурсы ограничены
    Превосходство над природой Гармония с природой
    Природа враждебна или нейтральна Природа дружественна
    Управляемая окружающая среда Окружающая среда в хрупком равновесии
    Информационно-технологическое развитие общества Социокультурное развитие
    Рыночные отношения Общественные интересы
    Риск и выигрыш Гарантии безопасности
    Индивидуальное самообеспечение Коллективистская организация
    Разумность средств Разумность целей
    Информация, запоминание Знание, понимание
    Образование Культура

    В ППР часто встречается термин критерий, который конкретизирует цель. Синонимами этого термина являются такие понятия как "критериальная функция" или "целевая функция". Именно критерий позволяет реализовать механизм выбора конкретного варианта из заданного множества, поскольку является способом сравнения вариантов.

    От критерия требуется максимальное сходство с целью, чтобы выбор по критерию соответствовал явному движению к поставленной цели. Понятно, что полного совпадения с целью критерий не представляет. Это, скорее, аппроксимация цели, ее модель.

    Для ЛПР формирование критерия представляет исключительно важный момент, в значительной мере определяющий корректность получаемого результата.

    Сложность задачи принятия решений существенно зависит от числа критериев. При одном критерии задача сопоставления нескольких вариантов наиболее проста для ЛПР. Однако в последнее время в практической деятельности все чаще встречаются многокритериальные задачи ПР.

    При графической интерпретации задач ПР критерии откладываются по оси Y.


    1.7. Физиология принятия решений

    Органом, который обеспечивает мыслительную деятельность человека, и в частности отвечает за принятие решений, является головной мозг. В конце ХХ века были получены убедительные данные относительно асимметрии полушарий головного мозга, согласно которым левое полушарие отвечает за аналитическую деятельность человека, а правое обеспечивает его творческие возможности. В то же время еще ранее было доказано, что левое полушарие управляет правой частью тела человека, а правое – левой. Многие ученые убеждены, что у "правшей" сильнее развито левое полушарие, которое доминирует в их поведении, а у "левшей" — наоборот.

    Поскольку мы живем в "праворуком" мире, то для большинства людей более характерно рациональное логическое мышление, чему способствует доминирование левого полушария. Казалось бы, такие люди должны лучше принимать решения. Однако это не совсем так. Специальные исследования показали, что надлежащий выбор производит тот, кто способен к образному мышлению, т.е. наделен даром "видеть" развитие ситуации до ее наступления. Для специалистов по техногенной безопасности развитие подобного качества представляется исключительно важным. Нет, видимо, более важного вида человеческой деятельности, чем обеспечение безопасности, где поговорки "после драки кулаками не машут" и "гром не грянет — мужик не перекрестится" были бы столь актуальны.

    Таким образом, сочетание способностей логико-аналитической переработки информации и интуитивно-чувственного прогнозирования исходов альтернативных ситуаций — вот идеальный уровень мыслительных возможностей современного специалиста, выступающего в качестве ЛПР. Понятно, что функции "слабого" полушария могут быть усилены за счет осознания данного факта и соответствующих тренировок.


    1.8. Виды и особенности задач принятия решений

    Требования к процедуре выбора определяют вид задач ПР. Остановимся на трех основных типах подобных задач.

    Упорядочение альтернатив. Существуют задачи, в которых требуется определить порядок на множестве альтернатив. Так, инженер по охране труда (ОТ), планируя на определенный календарный период мероприятия по обеспечению производственной безопасности, формирует их перечень в порядке важности; выпускники вуза распределяются по общим успехам за время обучения и т.д.

    Разделение альтернатив на упорядоченные группы. Объединение объектов в группы — очень характерное занятие для людей. Врач, обследующий больных, может выделять группы пациентов в соответствии с подозрениями на разные заболевания; куратор делит студентов на группы отличников, хорошистов, троечников и т.д.

    Выбор лучшей альтернативы. Эта задача традиционно считается одной из основных в принятии решений. Она часто встречается на практике. С такой проблемой сталкивается абитуриент при выборе специальности при поступлении в вуз; выпускник выбирает конкретное место работы; руководитель проектной организации определяет проект будущего объекта и т.п.

    Для ЛПР задача ПР может быть совершенно новой или повторяющейся. Это влияет на его степень информированности. Если ЛПР ощущает недостаток информации, то ему для получения эффективного результата целесообразно использовать поддержку эксперта.

    Очень сильно на сложность выбора влияет размерность задачи, под которой понимается количество критериев и число альтернатив. Сложность существенно возрастает при переходе от одного к двум и более критериям. Количество альтернатив влияет на сложность: несколько альтернатив обычно трудностей при выборе не вызывают; эти трудности появляются, когда их число составляет несколько десятков; нередко встречаются ситуации, в которых число альтернатив достигает многих сотен или даже тысяч. Сложность выбора при этом становится значительной.

    Для задач высокой размерности, как правило, требуется так называемая формализация, т.е. представление процедуры выбора в виде алгоритма, что открывает возможность применения вычислительной техники.

    Опытный ЛПР в процессе принятия решений иногда использует специальные приемы, которые получили название эвристик.

    Эвристика — в широком смысле слова раздел психологии, изучающий природу мыслительных операций человека при решении им различных задач; в узком смысле — приемы и методы поиска решений, основанные на интуиции и учете результатов решений сходных задач в прошлом, накопленном опыте, анализе ошибок.

    Действуя в рамках эвристического набора правил, ЛПР манипулирует следующими характеристиками:

  • вероятность выигрыша;
  • размер выигрыша;
  • вероятность проигрыша;
  • размер проигрыша и некоторыми другими.

  • Использование эвристик не всегда гарантирует хороший результат. Однако их достоинство заключается в том, что они способны радикально упростить исходную задачу и тем самым существенно снизить ее сложность. В ряде случаев такой подход оказывается единственным способом решения задачи.


    1.9. Понятие информации

    Информация — абстрактное понятие, которое выражается в виде данных, являющихся ее носителями. В ППР информация является основным ресурсом.

    Для ПР необходимо некоторое количество информации, которое называется информационной потребностью. Обозначим это количество информации через Im (рис. 2).

    Рис. 2. Удовлетворение информационной потребности

    Источники информации: Д1, Д2, …, Дn — документы; Э1, Э2, …, Эm — эксперты; темным цветом показано дублирование информации, серым — востребованные части источников

    Информация обладает свойством рассеивания, что может быть выражено следующей формулой:

    I=Im(1-e-λN),

    где Im — потенциально необходимый объем информации; N — количество привлеченных информационных источников (документов и экспертов);λ>0 — коэффициент, характеризующий степень рассеивания и дублирования информации.

    Другим свойством информации является ее старение, что выражается формулой:

    C=C0•e-βt,

    где С0 — первоначальная ценность информации; β>0 — коэффициент, характеризующий процесс старения; t — время.

    Еще одна из особенностей информации заключается в том, что она в отличие от других ресурсов не уменьшается при передаче и использовании.

    В ППР постоянно происходит общение разных людей. При межличностной и межгрупповой коммуникациях возможны значительные потери и искажение информации, что объясняется следующими причинами:

    • человек не может в процессе общения передать без каких-либо искажений всю информацию, которая содержится в его сознании и касается конкретной проблемы; в экстремальных ситуациях эти искажения особенно существенны;

    • часть информации теряется из-за ограниченного словарного запаса человека, а часть — содержится на уровне подсознания и словами вообще не выражается;

    • часть информации утаивается, если ее озвучивание невыгодно говорящему;

    • из-за возможного дефицита времени какая-то информация не проговаривается;

    • многое из сказанного не усваивается другим участником ППР из-за невнимательности или трудностей понимания (особенно в экстремальных ситуациях);

    • услышанное человек обычно подвергает собственной интерпретации, что при дальнейшей коммуникации может создать ситуацию "испорченного телефона".

    Неправильное понимание участниками ППР друг друга из-за искажения информации часто затрудняет достижение эффективного результата, что мы постоянно наблюдаем в повседневной жизни. Специалисты по безопасности жизнедеятельности в своей практической работе на эти особенности передачи информации должны обращать особое внимание.


    1.10. Информационная структура принятия решений

    Будем оценивать информацию с точки зрения ее количества, которое обозначим как I и неопределенности (энтропии), которую будем обозначать как E.

    Принимаемое решение характеризуется числом параметров n и шириной интервала lj, в котором может меняться каждый параметр (j=1, 2, …, n). Введем понятие количества альтернатив в каждом интервале (от него зависит свобода выбора):

    где δj — точность решения по j-му параметру.

    Так, в нашем примере с переходом автомагистрали выбор пешехода характеризуется двумя параметрами (n=2):

    - скорость движения;

    - направление движения.

    Очевидно, что скорость может меняться примерно от 0 до 10 км/час, т.е. l1=[0, 10]. Будем считать, что в этом интервале у пешехода четыре альтернативы (N1=4): стоять на месте, переходить дорогу очень медленно, в нормальном ритме, бегом. При этом δ1=3 км/час.

    Энтропия принимаемого решения определяется по формуле:

    где Pkj — вероятность, что j-й параметр при нашем выборе попадет в интервал kj из отрезка lj.

    Для случая равномерного распределения вероятности предыдущая формула упрощается и принимает вид:

    Чем шире исходный интервал lj, тем неопределенность больше. Зависимость энтропии от количества информации имеет вид (рис. 3):

    Рис. 3. Связь энтропии и информации при ПР

    При практическом отсутствии информации, когда I<Iп (Iп — пороговый объем информации) решение принимать не имеет смысла — сделать правильный выбор невозможно. Начиная с некоторого объема информации Iпр, дальнейшее затягивание с ПР особого смысла не имеет, т.к. надеяться на существенное снижение неопределенности не приходится. Из рис. 3 также можно сделать вывод, что приращение информации dI особенно эффективно на начальных этапах снижения неопределенности.

    Анализируя сказанное, можно сформулировать тип называемый принцип минимальной заблаговременности, который целесообразно использовать в некоторых ситуациях: оттягивание решения целесообразно до момента, за которым собственно ППР теряет смысл.

    На этом принципе основано поведение не очень уверенного в своих силах абитуриента, подающего документы для поступления в университет. Только в последней день работы приемной комиссии он определяется с выбором специальности, тщательно анализируя любую информацию, которая хотя бы незначительно указывает на специальности с наименьшим конкурсом.

    1.11. Формализация принятия решений

    Формально задача ПР может быть представлена следующим образом:

    где S0 — проблемная ситуация; t — время для ПР; R — ресурсы, потреб-ные для ПР;

    — множество целей, преследуемых при ПР;

    — множество ограничений;

    — множество альтернатив;

    p — функция предпочтения ЛПР;

    — множество критериев выбора наилучшего решения;

    Х* — оптимальное решение.

    Собственно процедура выбора представляется в виде:

    где Ф — правило (механизм) выбора.

    Существует ряд подходов к формализации ППР:

    - критериальный выбор;

    - выбор на основе анализа бинарных отношений;

    - групповой выбор.

    В разделах 2-5 учебного пособия рассмотрены разные задачи ПР, основанные на критериальном выборе; в разделе 6 — на анализе бинарных отношений; в разделе 7 — на основе группового выбора. Последний раздел посвящен вопросам компьютерной поддержки ППР.


    Вопросы для самостоятельной работы

    1. Что такое системный анализ?

    2. Какое место занимает выбор в процессе принятия решений?

    3. На каких науках базируется теория принятия решений?

    4. Приведите примеры принятия решений, которые привели к трагическим последствиям.

    5. Укажите лиц, принимающих участие в процессе принятия решений.

    6. Дайте понятие альтернативы, цели и критерия.

    7. Какие факторы усложняют процесс принятия решений?

    8. Назовите основные виды задач принятия решений. Приведите примеры из своей практики.

    9. Объясните, что такое информация и назовите ее основные свойства.

    10. Какие факторы влияют на результат процесса принятия решений?

    11. Объясните, для чего нужна формализация при принятии решений?

    12. Какие ответственные решения вам приходилось принимать? Оцените их последствия.

    Одной из проблем, связанных с надежностью и развитием электрических сетей, является надежность работы силовых трансформаторов. Основное количество трансформаторов энергосистем России было введено в эксплуатацию в 70-е и начале 80-х годов XX в. В настоящее время накоплен достаточно большой опыт эксплуатации, позволяющий провести анализ и дать рекомендации по повышению надежности работы силовых трансформаторов напряжением 110 кВ и выше, что и является целью данной статьи.

    Анализ повреждаемости трансформаторов и автотрансформаторов напряжением 110 - 500 кВ мощностью 63 МВА и более, эксплуатируемых на предприятиях электрических сетей, включая межсистемные сети России, за период 1998 -2002 гг. показывает, что удельное число технологических нарушений в работе указанных трансформаторов, приведших к их отключению действием автоматических защитных устройств или вынужденному отключению персоналом по аварийной заявке, составляет 1,8% в год. При этом около 30% общего числа этих технологических нарушений сопровождались возникновением внутренних коротких замыканий в трансформаторе.

    Основными причинами технологических нарушений, не сопровождавшихся внутренними КЗ, но приведших к отключению действием автоматических защитных устройств или вынужденному отключению персоналом по аварийной заявке, являются (в процентах общего числа нарушений):

  • нарушения в работе РПН - 20%;
  • течи масла из вводов - 16%;
  • течи и упуск масла из трансформатора из-за нарушения сварных соединений и резиновых уплотнений - 13%;
  • повреждение двигателей маслонасосов системы охлаждения - 4%;
  • повышение давления в высоковольтных герметичных вводах - 3%;
  • повреждение оболочки пленочной защиты - 2%.
  • Основными причинами технологических нарушений, сопровождавшихся внутренним КЗ в трансформаторе, являются (в процентах общего числа повреждений трансформаторов, сопровождавшихся внутренними КЗ):

  • пробой внутренней изоляции высоковольтных вводов — 48%;
  • недостаточная стойкость при КЗ — 14%;
  • износ изоляции обмоток — 12%;
  • пробой изоляции обмоток — 7%;
  • пробой изоляции отводов, нарушения контактного соединения отвода обмотки, обрыв части проводников гибкой связи, замыкание на ярмовую балку магнитопровода и корпус бака — 5%;
  • повреждения РПН — 5%.
  • Из имевших место повреждений с внутренними КЗ 24% происходили с возгораниями и пожарами трансформаторов. При этом удельная повреждаемость силовых трансформаторов и автотрансформаторов напряжением 110-500 кВ мощностью 63 MB-А и более, эксплуатируемых на предприятиях электрических и межсистемных сетей, сопровождавшаяся внутренними КЗ, составляет 0,45% в год.

    2. Однокритериальные задачи принятия решения

    2.1. Постановка задачи

    В данном разделе процесс принятия решений рассматривается как максимизация (минимизация) одного критерия. Таким образом, речь идет о критериальном ППР. При этом предполагается, что каждую альтернативу можно оценить конкретным числом (значением критерия) и, таким образом, сравнение альтернатив сводится к сравнению соответствующих им значений критерия.

    Обозначим множество альтернатив как , а конкретную альтернативу через Х. Считается, что для всех может быть задана функция, которая используется для сопоставления различных альтернатив, т.е. выполняет роль критерия. Эта функция часто называется как целевая функция, функция полезности, критерий качества и т.д.

    Обозначим целевую функцию буквой f. Тогда действие, связанное с оценкой альтернативы, будет иметь вид:

    а собственно ППР:

    при поиске максимума;

    при поиске минимума,

    при этом результатом ППР являются Х* и Z* = f (X*).

    Из сказанного понятно, что важнейшим понятием целевой функции является экстремальность. Различают (рис. 4):

    - глобальные экстремумы;

    - локальные экстремумы.

    При принятии решения обычно ставится задача найти глобальный экстремум.

    Рис. 4. Вид целевой функции и ее экстремума: a, c, e — минимумы; b, d, f — максимумы; a, c, b, d — локальные; e, f — глобальные

    Функция, имеющая один экстремум, называется унимодальной. Неограниченная функция может не иметь экстремумов.

    Если Х представляет точку в n-мерном пространстве, то тогда это вектор — Х=(х1, х2, … хn), для одномерного пространства Х=х, т.е. вектор вырождается в скаляр. Величину xi, i=1, 2, …, n в дальнейшем будем называть переменной.

    2.2. Понятие допустимой области

    В ряде случаев в качестве альтернативы может быть выбрана любая точка n-мерного пространства. Обычно на практике на выбор альтернативы накладываются дополнительные условия, которые выступают в виде ограничений на изменение вектора Х. Такие ограничения называют параметрическими. В n-мерном пространстве могут быть участки, в которых по каким-либо причинам выбор альтернативы также запрещается. Обычно границы этих участков задаются посредством функциональных ограничений.

    Таким образом, область пространства, в которой поиск результата разрешен, называется допустимой областью.

    Например, для целевой функции Z=x3 параметрическое ограничение может иметь вид: -1x1.

    В случае двух переменных задание параметрических ограничений в качестве допустимой области образует на плоскости х12 элементарный прямоугольник (рис. 5).

    Рис. 5. Допустимая область

    В общем случае функциональные ограничения представляются в виде неравенства: Pj (Х)0 или Pj (Х)0, j=1, 2, …, m.

    При появлении функциональных ограничений прямоугольник искажается и ДО приобретает сложную конфигурацию (рис. 6).

    Рис. 6. Конфигурации допустимой области: виды ДО: выпуклые (а); вогнутые (б); несвязные (в)

    ДО называется выпуклой, если все точки отрезка, соединяющего любые точки, принадлежащие ДО, целиком в ней содержатся.

    Различают задачи безусловной (рис. 7) и условной (рис. 8) оптимизации. В первых задачах понятия ДО нет, т.е. поиск экстремумов целевой функции ведется во всем пространстве изменения переменных.

    Рис. 7. Безусловная оптимизаци

    Рис. 8. Условная оптимизация

    2.3. Линии равного уровня

    Пусть имеем функцию двух переменных Z=f (x1, x2). Представим ее в трехмерном пространстве. Полученные фигуры будем сечь плоскостями, параллельными плоскости х12.

    а)

    б)

    Рис. 9. Линии равного уровня: а — унимодальная целевая функция; б — двухэкстремальная целевая функция

    Тогда проекции линий пересечения образуют на плоскости х12 так называемые линии равного уровня, где значение целевой функции постоянно (рис. 9).

    Если заданы линии уровня многоэкстремальной целевой функции, то различать экстремумы можно с помощью специальных пометок, которые проставляются в разрывах линий равного уровня (как на географических картах) (рис.10).

    Рис. 10. Трехэкстремальная целевая функция: b — глобальный; а, с — локальные минимумы

    2.4. Условие стационарности

    Пусть имеется функция f(Х). Градиент этой функции grad f(Х) — вектор, который определяется как:

    Например, пусть имеется функция f(Х) = x12+x23.

    Для точки с координатами (1, 1) grad будет иметь следующий вид (рис. 11):

    Рис. 11. Построение градиента

    Градиент указывает направление наискорейшего увеличения функции, антиградиент — наискорейшего убывания. Градиент перпендикулярен касательной к линии уровня.

    Если в какой-то точке grad равен 0, то такая точка называется стационарной. Например, стационарность точки А математически записывается следующим образом:

    Условие стационарности необходимо для существования экстремума, но недостаточно. Среди стационарных точек, кроме экстремальных, могут встречаться также седловые точки (точки перегиба).

    Часто аналитическое определение градиента невозможно. Тогда применяют численные методы.

    Формула для определения градиента численным методом имеет вид:

    При Dхi ð 0 — точность определения градиента возрастает.

    2.5. Условия Куна-Таккера

    Предположим, что экстремум целевой функции находится на границе допустимой области, например, в точке х* (рис. 12).

    Рис. 12. Целевая функция

    В точке х* условие стационарности для функции f(x) не выполняется, хотя она является экстремальной.

    Сконструируем специальную функцию, которая называется функцией Лагранжа:

    где рj (Х) — левая часть j-го неравенства, формирующего допустимую область j=1, 2, …, m; lj — множители Лагранжа (вспомогательные коэффициенты).

    Здесь необходимо заметить, что на рис. 12 ДО формируется параметрическими ограничениями, которые в приведенной выше формуле рассматриваются как частный случай функциональных ограничений.

    Можно доказать, что граничная экстремальная точка f(Х) является стационарной точкой функции L(Х). Для нахождения координат этой точки составляют несколько уравнений, которые формируют два условия Куна-Таккера:

    1) λj × рj (X*)=0, j=1, 2, …, m;

    2) grad f (X*)+grad

    Данные условия должны выполняться для экстремальной точки функции . Определение координат этой точки и является нашей задачей.

    Пусть, например, требуется найти максимум функции:f(X)=x1+x2.

    ДО формируется следующими функциональными ограничениями (рис. 13):

    x1-x20;

    x2-x120.

    Рис. 13. Вид допустимой области

    Из условий Куна-Таккера получим следующие уравнения:

    l11 – х2) = 0
    l2(х2 – х12) = 0

    из первого условия

     
    1 + l1 – 2 l2х1 = 0
    1 –
    l1 + l2 = 0
    из второго условия

    Решая систему четырех уравнений с четырьмя неизвестными, получаем:

    х1* = 1; х2* = 1; Z* = 2

    l1 = 3; l2 = 2.

    На практике данный подход применяется редко из-за трудностей, связанных с аналитическим нахождением частных производных.

    2.6. Метод штрафных функций

    Метод штрафных функций близок к идеям Куна-Таккера. Он позволяет задачу условной оптимизации преобразовать в задачу безусловной оптимизации.

    Смысл этого преобразования заключается в отказе от ограничений, формирующих допустимую область, через модификацию целевой функции, которая в определенной степени становится похожа на функцию Лагранжа. При этом, естественно, результат, получаемый на новой целевой функции, должен соответствовать результату исходной задачи. Сразу отметим, что в отличие от предыдущего метода, метод штрафных функций является численным и на практике используется значительно чаще.

    Формальная возможность решать задачу безусловной оптимизации в ряде случаев позволяет более эффективно использовать некоторые численные методы нахождения экстремума [9].

    Пусть требуется максимизировать функцию f(Х) при рj (Х)0; j=1, 2,…, m.

    Формируемая в этом случае штрафная функция имеет следующий вид:

    В допустимой области штрафная функция равна нулю. В недопустимой области она отрицательна. Оптимизации (в рассматриваемом случае — максимизации) подвергается функция:

    Z(X) = f(X) + P(X) × k.

    Коэффициент k1. При первом расчете k=1; если экстремум функции Z(x) оказался за рамками ДО, тогда k увеличивают (ужесточают штраф) и выполняют новый расчет, до тех пор, пока найденный экстремум не будет находиться в допустимой области.

    Следует отметить, что здесь и дальше для реализации вычислений предполагается использование персонального компьютера.

    2.7. Задача об оптимальном рационе

    В качестве примера практического использования приведенного выше математического аппарата рассмотрим процедуру выбора продуктов питания, которая может быть использована для определения так называемой потребительской корзины.

    Пусть имеется n продуктов (хлеб, мясо, молоко, картофель и т.д.) и m полезных веществ (жиры, белки, углеводы и т.п.), необходимых для жизнедеятельности человека. Обозначим через аij — содержание j-го вещества в единице i-го продукта, через bj — потребность индивидуума в j-м веществе (скажем, в месяц) и через ci — цену единицы i-го продукта.

    Обозначив потребление индивидуумом i-го продукта через хi, получаем задачу о выборе наиболее дешевого рациона питания (стоимости месячной продовольственной потребительской корзины) [11]:

    при ограничениях

    и

    Поскольку и целевая функция, и ограничения линейны, то данная задача называется задачей линейного программирования, в отличие от более распространенных задач нелинейного программирования, в которых имеет место нелинейность целевой функции и (или) ограничений.

    Выясним, что представляет собой допустимая область на плоскости х12 в случае только двух продуктов x1 и x2. Из неравенств (2.2) вытекает, что ДО расположена в первом квадранте, а каждое неравенство (2.1) геометрически определяет множество точек, лежащих по одну сторону от прямой (рис. 14). Следовательно, для трех полезных веществ (m=3) ДО представляет собой неограниченное множество (рис. 15).

    Рис. 14. Допустимая область при одном ограничении

    Рис. 15. Допустимая область при трех ограничениях

    Рис. 16. Геометрическая интерпретация задачи

    Введем линии равного уровня целевой функции, т.е. линии, на которых в плоскости х12 целевая функция

    принимает постоянное значение. Очевидно, каждая такая линия является прямой.

    Для графического нахождения оптимального решения следует наносить линии уровня до тех пор, пока хотя бы одна точка какой-то линии будет находиться в ДО. При этом эта линия коснется либо какой-то вершины, либо какого-то ребра допустимой области (в нашем случае это точка А) (рис. 16).

    На практике для решения задач линейного программирования используется так называемый симплекс-метод.

    Вопросы для самостоятельной работы

    1. Какие особенности имеют однокритериальные задачи принятия решений?

    2. Что такое допустимая область?

    3. Как называется функция, экстремальная точка которой обычно ищется в процессе принятия решений?

    4. Нарисуйте график произвольной функции и укажите ее экстремумы.

    5. Как называются линии, где значение целевой функции постоянно?

    6. Определить значение градиента для функции Z=ax1m + bx2n. Построить градиент для точки с координатами х1=f; х2=g.

    7. Методом Куна-Таккера найти экстремум целевой функции Z=ax1 + bx2 при следующих ограничениях х1 – сх2 0; х2 – dх12 0.

    8. Нарисовать в плоскости х12 допустимую область, сформированную параметрическими ограничениями сx1d; fx2g.

    9. Объяснить, чем отличается задача условной оптимизации от задачи безусловной оптимизации.

    10. Объяснить, в чем отличие задач линейного и нелинейного программирования.

    11. Сформировать штрафную функцию, если заданы только параметрические ограничения сx1d; fx2g.

    12. Взять произвольную функцию двух переменных. Для точки с координатами [a, b] рассчитать численным методом и построить градиент.

    13. Как отличается штрафная функция при решении задачи максимизации от штрафной функции при решении задачи минимизации?

    14. Сформировать целевую функцию и задать ограничения. Составить для этой задачи условия Куна-Таккера.

    15. С помощью условий Куна-Таккера определить Х*, максимизирующий функцию f(x1, x2)=ax1+bx2+cx1x2-dx12-ex22 при ограничениях х12h, х10, х20.

    3. Методы принятия решения при одном критерии

    3.1. Градиентный метод

    Пусть имеется целевая функцию f(X). Надо найти ее экстремум.

    Выбирается некоторая точка Х0 — стартовая точка. В ней определяется grad, если решается задача максимизации, и анти-grad, если решается задача минимизации. Вдоль этого вектора делается шаг e, который завершается в точке Х1. В этой точке вновь определяется grad, снова делается шаг e и т.д.

    Критерием остановки вычислительного процесса является значение grad, равное нулю.

    Рис. 17. Поиск экстремума функции f(X)

    Данный метод имеет следующие недостатки:

    1) при большом шаге можно проскочить экстремум;

    2) при малом шаге увеличивается время расчета;

    3) данный метод плохо работает в случае оврагообразных целевых функций;

    4) метод плохо работает в задачах условной оптимизации: grad упирается в какое-нибудь ограничение и дальше процесс поиска экстремума прекращается;

    5) при многоэкстремальной целевой функции результатом может оказаться локальный экстремум;

    6) имеются трудности с выработкой критерия останова вычислительного процесса.

    3.2. Метод сканирования (перебора)

    Среди методов принятия решения перебор вариантов (метод проб и ошибок) занимает особое место. С древних времен он широко использовался для решения подобных задач.

    Пусть требуется минимизировать функцию двух переменных f(Х) = f(x1, x2). На рис. 18, а приведены линии равного уровня этой функции.

    Допустим, что переменная х1 принимает 6 значений: х1= х11, х12, …, х16, а переменная х2 – 5 значений: х2= х21, х22, …, х25.

    a)   б)

    Рис. 18. Поиск экстремума методом сканирования

    Суть метода заключается в определении и сравнении значений целевой функции во всех узлах сетки (рис. 18 б). Расчет обычно начинается с левого нижнего узла или слева направо, или снизу вверх, в зависимости от того, какая переменная меняется во внутреннем цикле. Алгоритм метода сканирования для данного случая в виде блок-схемы приведен на рис. 19.

    Рис. 19. Блок-схема метода сканирования при минимизации функции двух переменных

    Рис. 20. Иллюстрация неправильной настройки метода сканирования

    Критерием остановки процесса является реализация всех вычислений, число которых определяется по формуле:

    N = n1*n2* … *nn , где ni — число значений, принимаемых i-й переменной.

    Недостатки этого метода:

    1) невысокая точность (она определяется половиной шага); из рис. 18 б видно, что точка (х1*, х2*), принятая за искомую, имеет координаты (х15, х23), хотя понятно, что истинный экстремум находится в окрестности этой точки;

    2) с уменьшением шага возрастает время расчета и даже на быстродействующем компьютере оно может составить десятки минут и даже часов; особенно это заметно при большом числе переменных (n > 8¸10);

    3) при неудачном выборе диапазонов изменения переменных можно получить неправильный результат (рис. 20);

    4) в случае сложной конфигурации ДО много расчетов будет выполняться "вхолостую", т.е. целевая функция будет рассчитываться в точках, находящихся за пределами ДО.

    Достоинства

    1) простота, наглядность;

    2) для многоэкстремальных целевых функций имеется возможность найти глобальный экстремум.

    Метод сканирования на практике эффективен, когда число переменных не превышает 5/8, в противном случае даже на современных персональных компьютерах затраты времени на поиск результата могут быть очень значительными.

    3.3. Метод Гаусса-Зейделя (покоординатного спуска)

    Пусть требуется оптимизировать функцию f(Х) = f(x1, x2, …, xn).

    Выбирается некоторая стартовая точка Х0 (рис. 21). Из нее начинается процесс поиска, при этом меняется только одна переменная, например, х1. При изменении данной переменной оптимум целевой функции находится одним из известных методов: градиента, сканирования и т.д. Получается точка с координатами х1*, х20, …, хn0. После этого, из найденной точки организуется новый цикл, при этом меняется переменная х2. Получают точку х1*, х2*, х30, …, хn0 и т.д. до изменения хn. После этого организуется новый цикл по переменной х1 и получается точка х1**, х2*, …, хn*. Критерием остановки процесса является незначительное изменение значений как переменных, так и целевой функции.

    Рис. 21. Поиск экстремума методом Гаусса-Зейделя

    Из рис. 21 видно, что для нахождения результата потребовалось всего три цикла:

    • в первом – получена точка 1 с координатами (х1*, х20) (на рисунке подобные точки располагаются или примерно в середине интервала между одной линией уровня, или в месте касания следующей линии уровня);

    • во втором цикле получена точка 2 с координатами (х1, х2*);

    • в третьем цикле получена точка 3 с координатами (х1**, х2*); эта точка практически совпадает, как видно из рисунка, с действительным экстремумом целевой функции.

    Недостатки метода:

    1) метод малоэффективен, когда главные оси линий уровня не параллельны осям координат;

    2) метод плохо работает при наличии ограничений;

    3) в качестве результата может быть получен локальный экстремум;

    4) возникают трудности с выработкой критерия останова вычислительного процесса.

    3.4. Метод случайного поиска (Монте-Карло)

    Рассмотрим суть метода на следующем простом примере.

    Пусть требуется определить площадь сложной фигуры, расположенной в квадрате площадью S. Выберем в площади квадрата N случайных точек с равномерным законом распределения. Обозначим через N' число точек, попавших в площадь фигуры (рис. 22).

    Рис. 22. Определение площади фигуры

    Тогда искомую площадь можно приближенно определить по формуле:

    При N стремиться к бесконечности рассчитанная площадь будет стремиться к действительной.

    На этом принципе строится работа случайного поиска. Предположим, требуется найти экстремум функции двух переменных f(Х)=f(x1, x2). Для каждой переменной назначается интервал изменения, в котором она выбирается случайным образом. В точке Х' определяется значение целевой функции, которое запоминается. Случайно выбирается новое значение Х" и f(X") сравнивается с f(Х'). Если функция в новой точке Х'' имеет лучшее значение, то запоминается Х'' и f(X''). Затем выбирается Х''' и т.д.

    Можно доказать, что когда число случайных испытаний N стремиться к бесконечности, то точка с наилучшим значением целевой функции будет соответствовать глобальному экстремуму.

    Обычно координаты случайных точек определяются с помощью программного датчика случайных чисел. В простейшем случае распределение вероятностей для каждой переменной принимается равномерным.

    Критерием остановки процесса является выработка заданного количества случайных точек.

    Достоинства метода:

    1) простота и наглядность;

    2) универсальность;

    3) некритичность к размерности задачи: с ростом числа переменных время расчета растет существенно медленнее, чем в методе сканирования.

    Недостатки:

    1) в ряде случаев (особенно при малых N) недостаточная точность;

    2) для задач условной оптимизации большое число случайных испытаний происходит вхолостую (за пределами ДО), что непроизводительно увеличивает время расчета.

    В заключение данного раздела можно отметить, что существует большое количество методов для нахождения решения при наличии одной целевой функции. Более подробно с ними можно познакомиться с помощью [5, 9].

    Вопросы для самостоятельной работы

    1. Составить сравнительную таблицу, в которой указать достоинства и недостатки всех известных вам методов принятия решений при наличии одного критерия.

    2. Указать отличия блок-схем метода сканирования при поиске минимума и максимума целевой функции.

    3. Пусть требуется найти экстремум функции f(Х)=f(x1, x2, ..., x5). Какой метод нахождения результата предпочтительнее?

    4. Пусть требуется найти глобальный максимум функции f(Х)= f(x1, x2, ..., x5). Какой метод нахождения результата предпочтительнее при такой постановке задачи?

    5. Назовите метод поиска решения при одном критерии, который при своем функционировании предполагает использование другого метода. Сколько раз это происходит?

    6. Насколько вероятна ситуация, когда в процессе функционирования метода случайного поиска будет найден локальный экстремум?

    7. При функционировании градиентного метода и метода сканирования были найдены локальные экстремумы. Объясните эти ситуа-ции.

    8. Методом сканирования найти максимум целевой функции y=ax1+bx2 при ограничениях fx1g,  hx2k. Шаг по х1 принять равным dx1, а по х2 – dх2.

    9. Методом сканирования найти минимум целевой функции y=ax12+bx23 при ограничениях fx1g,  hx2k. Шаг по х1 принять равным dх1, а по х2 – dх2.

    10. Определить геометрические размеры огнетушителя (высоту h и радиус r), при которых его внутренний объем будет максимальным. Учесть при этом, что масса огнетушителя не должна превышать 10 кг, плотность огнетушащего средства равна 0,8 кг/дм3, а массу собственного цилиндра с арматурой можно принять постоянной и равной 3 кг. Кроме того, для удобства использования размеры огнетушителя должны удовлетворять условиям 7h/r9.

    11. Предыдущий вопрос сформулировать в математическом виде как задачу принятия решений с одним критерием. Нарисовать допустимую область и линии равного уровня целевой функции.

    4. Принятие решений в условиях неопределенности

    4.1. Платежная матрица

    В предыдущих разделах ППР рассматривался как выбор в таких условиях, когда последствия данного процесса определяются однозначно. Предполагая, что функция Z=f (X) имеет конечное (дискретное) множество значений, процедуру выбора можно представить в следующем виде:

    где Вi – конкретный i-й вариант, предъявляемый для анализа; Zi – значение целевой функции в i-м варианте; N – число рассматриваемых значений целевой функции (количество вариантов).

    На этой матрице-столбце можно поставить задачи по нахождению:

    что эквивалентно постановке задачи принятия решений, сделанной ранее.

    Во многих реальных задачах нередко приходится иметь дело с более сложной ситуацией, когда необходимо учитывать внешние факторы, которые носят случайный характер. Будем в дальнейшем предполагать, что речь идет о задаче безусловной максимизации.

    Пусть имеется N вариантов и L внешних состояний. Тогда матрица, подвергаемая анализу на предмет принятия решений, будет иметь вид:

      x1 x2 ... xj ... xL
    В1 Z11 Z12 ... Z1j ... Z1L
    В2 Z21 Z22 ... Z1j ... Z2L
    ... ... ... ... ... ... ...
    Вi Zi1 Zi2 ... Z1j ... ZiL
    ... ... ... ... ... ... ...
    BN ZN1 ZN2 ... ZNj ... ZNL

    Подобная матрица называется платежной. В этой матрице

    Подобная матрица называется платежной. В этой матрице xj — одно из внешних состояний, которое происходит случайно, независимо от воли ЛПР.

    j — одно из внешних состояний, которое происходит случайно, независимо от воли ЛПР.

    Таким образом, ЛПР должен принимать решение с учетом возможности реализации любого внешнего состояния. В этих условиях большую роль играет любая дополнительная информация. Понятно, что стратегия выбора здесь существенно отличается от ранее рассмотренных, хотя отдельные уже известные нам процедуры ПР оказываются уместными и при решении данных задач.

    Сначала для понимания особенностей подобного класса задач рассмотрим тривиальный пример. Пусть весной планируется покупка пары обуви на летний сезон. Для простоты ограничимся четырьмя возможными вариантами и будем оценивать эффективность обуви по десятибалльной шкале. Составим следующую матрицу:

      Сухое жаркое лето Дождливое холодное лето
    Резиновые сапоги 1 10
    Кроссовки 2 5
    Легкие туфли 10 2
    Ботинки 4 3

    Здесь два внешних состояния. О том, какое из них случится, заранее нам практически неизвестно.

    Другой, более сложный пример, взят из [10]. Предположим, что владелец небольшой кондитерской в начале каждого дня должен решать вопрос, сколько пирожных следует иметь в запасе, чтобы удовлетворить спрос. Каждое пирожное обходится ему в 3 рубля, а продается по 7 руб. Продать невостребованные пирожные на следующий день невозможно, поэтому остаток распродается в конце дня по 1 рублю за штуку.

    Составим платежную матрицу. В качестве вариантов в данной задаче фигурирует число закупаемых пирожных. Допустим, что их может быть: один, два, …, пять, т.е. имеем пять возможных вариантов. Внешние состояния определяются спросом. Допустим, что он колеблется от нуля до пяти пирожных в день.

      Спрос
    Загрузка   0 1 2 3 4 5
    1 -2 4 4 4 4 4
    2 -4 2 8 8 8 8
    3 -6 0 6 12 12 12
    4 -8 -2 4 10 16 16
    5 -10 -4 2 8 14 20

    Анализ матрицы показывает, что каждый вариант может быть выбран в ППР и желательно этому выбору придать определенную осмысленность, о чем пойдет речь ниже.

    4.2. Графическая интерпретация

    Пусть имеется два внешних состояния x1 и x2. Составим для такого случая платежную матрицу:

      x1 x2
    B1 Z11 Z12
    B2 Z21 Z22
    ... ... ...
    Bi Zi1 Zi2
    ... ... ...
    BN ZN1 ZN2

    Каждому внешнему состоянию поставим в соответствие свою координатную ось. На каждой из них отложим наибольшее и наименьшее значения из каждого столбца.

    Рис. 23. Поле решений

    Получили поле решений. В нем выделим некоторую точку, которую назовем утопической точкой (УТ). В этой точке каждая координата имеет максимальное значение. Данная точка так называется потому, что она, как правило, не существует. Противоположная ей точка — антиутопическая (АУТ), она имеет координаты min Zi1, min Zi2. Эти две точки образуют прямоугольник, в поле которого возьмем некоторую рассматриваемую точку (РТ). Проведя через эту точку прямые, параллельные осям координат, получим 4 квадранта.

    Для многомерного пространства эти квадранты называются конусами. Конус I называется конусом предпочтения. Все варианты, находящиеся в нем, лучше варианта, соответствующего РТ. Конус III — антиконус. Варианты, содержащиеся в нем, хуже варианта, соответствующего РТ. Если бы все варианты находились в конусе I или III, то проблем с принятием решения не возникало бы. Конусы II и IV называются конусами неопределенности. Здесь возникают сложности с выбором варианта.

    Для принятия решения в случаях, когда варианты находятся в конусах неопределенности, используются специальные критерии.

    4.3. Максиминный критерий

    В данном разделе теории ПР способы нахождения результата, которые выше мы называли методами, принято называть критериями. Не будем отступать от этой практики.

    Наиболее известным является так называемый максиминный критерий, имеющий следующий вид:

    где Zij — элемент платежной матрицы.

    Альтернатива, соответствующая оптимальному по данному критерию значению, определяется по формуле:

    В рамках данного раздела более удобно идентифицировать альтернативы не с помощью вектора Х, а через номер варианта Bi, i=1, 2, …, N. При этом каждый вариант при дальнейшей детализации характеризуется определенными координатами.

    Для получения результата с помощью максиминного критерия необходимо:

    1) платежную матрицу дополнить еще одним столбцом из наименьших результатов каждой строки (min Zij);

    2) выбрать тот вариант, в строке которого стоит наибольшее значение.

    Пусть имеем платежную матрицу:

      x1 x2 x3      
    B1 5 7 3   3  
    B2 11 4 20   4  
    B3 7 13 15   7 <=

    На основе данного критерия выбираем третий вариант. Использование этого критерия означает принятие решения с позиции крайнего пессимизма. Выбранный вариант полностью исключает риск. Это значит, что ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Этот критерий нашел широкое распространение в технике как один из базовых. Однако за отказ от риска приходится "платить", что хорошо иллюстрирует следующий пример.

      x1 x2  
    B1 1 100  
    B2 1,1 1,1

    Если состояние x2 встречается чаще, чем состояние x1, и решение реализуется многократно, то результат максиминного критерия нас может не устраивать. Подобный критерий оправдан, когда о внешних состояниях нам ничего не известно, решение реализуется один раз и необходимо исключить любой риск.

    Подобный подход бывает оправдан при эксплуатации сложной и дорогостоящей техники, в ситуациях, где риску подвергаются жизни людей и т.д.

    4.4. Критерий Байеса-Лапласа

    Алгоритм определения результата с помощью данного критерия имеет следующий формальный вид:

    Эта запись расшифровывается следующим образом:

    1) платежная матрица дополняется столбцом, содержащим математические ожидания каждой строки;

    2) из этого столбца выбирается вариант с максимальным значением.

    Этот критерий может использоваться, когда вероятности каждого события известны. Обычно его применяют, если решения реализуются много раз, а при малом числе реализаций допускается некоторый риск.

    В качестве примера рассмотрим следующую платежную матрицу:

      x1 x2 x3 x4
    В1 0,5 1 -0,5 2
    В2 2 2 0 -1
    В3 4 0 -0,8 1
    В4 0 0 2 1,5

    Предположим нам известно, что все внешние состояния равновероятны.

    Определяем математические ожидания по каждой стороне, а затем выбираем максимальное значение, т.е. третий вариант:

    0,25×0,5+0,25×1-0,25×0,5+0,25×2 = 0,75  
    0,25×2+0,25×2+0,25×0+0,25×1 0,75  
    0,25×4+0,25×0-0,25×0,8+0,25×1 1,05
    0,25×0+0,25×0+0,25×2+0,25×1,5 0,875  

    4.5. Максимаксный критерий

    Формальная процедура определения результата с помощью данного критерия имеет вид:

    Этот критерий выражает позицию крайнего оптимизма (азартного игрока). На практике он не используется, т.к. предполагает не-обоснованный риск.

    4.6. Критерий Сэвиджа

    Более сложным для понимания является критерий Сэвиджа, который определяется по следующему алгоритму:

    Математическая запись предполагает следующие действия:

    1) каждый элемент платежной матрицы вычитается из максимального элемента соответствующего столбца (действие в круглых скобках);

    2) полученные разности образуют матрицу остатков, которая дополняется столбцом результатов наибольших разностей (операция max j );

    3) выбирается вариант с наименьшим значением строки (операция min i ).

      x1 x2 x3              
    B1 5 9 3   5 0 2   5  
    B2 10 7 1 0 2 4 4
    B3 1 6 5   9 3 0   9  

    Данный критерий также называют критерием минимаксного сожаления, поскольку он позволяет определить вариант, при котором ЛПР несет наименьшие потери.

    Критерии максиминна (ММ), Байеса-Лапласа (BL) и Сэвиджа (S) относят к классическим критериям.

    4.7. Пример использования классических критериев

    Пусть некоторая машина производит определенную продукцию [7]. Реальное состояние машины неизвестно. Но потенциально оно может быть следующим:

    x1 — неисправностей нет;

    x2 — незначительные неисправности;

    x3 — серьезная неисправность.

    Если неисправность проявляется, то машина останавливается, требуются затраты на ее восстановление и затраты, связанные с приостановкой выпуска продукции.

      x1 x2 x3

    ММ

     

    BL

       

    S

         
    В1 -20 -22 -25 -25 -22,3   20 0 0 20  
    В2 -14 -23 -31 -31   -22,7   14 1 6 14
    В3 0 -24 -40 -40   -21,3 0 2 15 15  

    Пример специально составлен так, чтобы каждый критерий предлагал свое решение. Если это происходит на практике, то нет оснований для разочарования. Дело в том, что реальные платежные матрицы могут содержать десятки и сотни строк (альтернатив) и стягивание этого множества до нескольких (2-3) вариантов оказывается исключительно полезным.

    Кроме этого, в ППР всегда важно привлекать дополнительную информацию.

    Если в нашем примере речь идет о сотне машин, то целесообразнее использовать критерий Байеса-Лапласа. Чем уникальнее оборудование, тем больший вес приобретают более осторожные методы. Нередки ситуации, когда рекомендации разных критериев совпадают. Предположим, что серьезная неисправность встречается достаточно часто, т.е. Р1 = Р2 = 0,25; Р3 = 0,5.

    Тогда ММ и BL рекомендуют один и тот же – первый вариант. Если удается снизить затраты на полную проверку, например:

      x1 x2 x3  
    В1 -18 -20 -22  
    В2 -14 -23 -31  
    В3 0 -24 -40

    то в этом случае все критерии будут рекомендовать выбор первого варианта.

    4.8. Понятие слабого и сильного доминирования

    Если при анализе платежной матрицы все критерии дают одну и ту же рекомендацию, в этом случае говорят о слабом доминировании предлагаемого к выбору варианта.

    Сильное доминирование всех вариантов, например, над первым вариантом имеет место, когда выполняются следующие условия:

    Z1j <= Zij, j=1, …, L и хотя бы для одного j выполняется строгое неравенство Z1j < Zij.

    B1 5 6 1 B2 и B3 доминируют над B1, и этот вариант может быть исключен из рассмотрения.
    B2 10 7 1
    B3 5 9 3

    В случае сильного доминирования одного варианта, например, первого над остальными должны выполняться условия:

    Z1j ³ Zij и хотя бы для одного j Z1j > Zij.

    B1 11 9 5 B1 доминирует над B2 и B3
    B2 5 9 3
    B3 10 7 5

    Понятно, что в случае сильного доминирования одного варианта результат использования всех критериев однозначен, т.е. слабое доминирование является частным случаем сильного.

    4.9. Критерий Гурвица

    Стремление занять уравновешенную позицию, т.е. оказаться между состояниями крайнего пессимизма и оптимизма привело Гурвица к конструированию следующего критерия:

    где 0 с 1 – весовой коэффициент.

    Платежная матрица при поиске решения дополняется столбцом, содержащим средневзвешенное значение наименьшего и наибольшего результата для каждой строки. Затем выбирается вариант с максимальным значением.

    Если с=0, то критерий Гурвица вырождается в максимаксный критерий; если с=1, то — в максиминный. Обычно с принимают равным 0,5.

    Возможно нахождение с таким образом: анализируется платежная матрица; с помощью классических критериев определяют подходящий вариант; с учетом найденного варианта подбирается весовой коэффициент, который затем в составе критерия HW используется при нахождении решения на основе других платежных матриц.

    Критерий Гурвица целесообразно использовать, когда:

    1) о вероятностях xj ничего не известно;

    2) допускается риск (чем меньше с, тем риск больше);

    3) реализуется малое количество решений.

    4.10. Критерий Хаджа-Лемана

    Данный критерий опирается на два классических критерия: ММ и BL.

    Вместо коэффициента с вводится близкий ему по смыслу параметр , который выражает степень доверия к распределению вероятностей.

    Если это доверие велико, то преобладает критерий ВL, если мало, то — ММ критерий.

    При =1 критерий HL вырождается в критерий BL, при =0 – в ММ.

    При использовании данного критерия платежная матрица дополняется столбцом из средних взвешенных математического ожидания и наименьшего результата каждой строки. Затем выбирается вариант с максимальным значением.

    На практике критерий HL используется сравнительно редко, из-за необходимости наличия распределения вероятности внешних состояний.

    Критерии HW и HL и ряд других относят к производным критериям.

    4.11. Риск при принятии решения

    Вероятность выбора ошибочных решений обусловливает риск при принятии решений. Полное устранение риска в ППР проблематично, т.к. ориентация на ММ критерий, как указывалось выше не всегда оправдана. В большинстве случаев целесообразно допускать некоторый риск, но он каждый раз должен быть оправдан. В качестве опорного значения для оценки риска применяется ММ критерий. В случае выбора какого-то варианта, отличного от рекомендуемого этим критерием, степень неоптимальности можно представить в виде так называемого дефекта варианта решения относительно опорного критерия:

    Риск определяется в тех же единицах, что и платежная матрица. Максимальную разность дефектов при рассмотрении всех вариантов матрицы охарактеризуем как возможный риск:

    Возвращаясь к примеру из раздела 4.1, составим таблицу с минимально и максимально возможными доходами, а также риском для каждого варианта.

    Т а б л и ц а  2

    Риск при продаже пирожных

    Количество закупаемых пирожных Минимальный доход в день, руб. Максимальный доход в день, руб.

    Риск, руб.

    1 -2 4 0
    2 -4 8 2
    3 -6 12 4
    4 -8 16 6
    5 -10 20 8

    ППР регламентируется не только уровнем риска, но и таким понятием, как его приемлемость. Здесь во внимание принимается собственно субъект, выступающий в качестве ЛПР. Для примера рассмотрим два варианта вложений суммы в 1000 рублей.

      x1 x2
    В1 1100 1100
    В2 2000 0

    По В1 без какого-либо риска можно получить 10 % прибыли на вложенные деньги, т.е. через месяц сумма возрастет до 1100 рублей. По второму варианту можно либо потерять все деньги, либо их удвоить.

    Понятно, что приемлемый риск при выборе второго варианта совершенно различен, например, для студента и крупного предпринимателя. Для первого  1000 рублей, возможно, последние деньги и ориентироваться на x1 он может только в том случае, если вероятность благоприятного исхода близка к 1. Для предпринимателя же возможная потеря 1000 рублей разорительной не явится, в его случае приемлемый риск существенно выше.

    4.12. Технология принятия решения

    В ППР наряду с анализом ситуации и постановкой задачи можно выделить такие этапы:

    • анализ и комбинирование внешних условий xj, j=1, 2, …, L;

    • выработка вариантов Bi, i=1, 2, …, N;

    • построение платежной матрицы;

    • сбор и анализ дополнительной информации и выбор критерия;

    • нахождение оптимального варианта, проверка и оформление результата.

    4.13. Анализ и комбинирование внешних условий

    Данный этап реализуется посредством построения так называемого дерева событий. Предположим, имеются три параллельно работающих агрегата: А1, А2, А3. Пусть вероятность аварии на каждом агрегате равна Рi = 10-3, i=1, 2, 3.

    Данную ситуацию можно представить в виде дерева событий, на котором работающий агрегат будет обозначен как Аi, а отказавший — как Āi (рис. 24).

    Рис. 24. Дерево событий

    Каждая ветвь дерева событий описывает одно из возможных состояний сложной системы, что логично воспринимать как независящее от нас событие xj, j=1, 2, …, 8.

    В прямоугольниках на дереве событий (терминальных узлах) указывается конкретный результат события, соответствующий пути к этому узлу.

    4.14. Выработка вариантов

    Совместный учет внешних событий  xj и возможных вариантов Bi можно представить в виде дерева решений.

    В этом дереве различают:

    • узлы событий

    • узлы решений

    В узлах событий выбор дальнейшего пути определяется внешними условиями, а в узлах решений — ЛПР. Таким образом, все возможные действия со стороны ЛПР могут быть связаны только с узлами решений.

    В качестве примера рассмотрим дерево решений (риc. 25).

    Терминальные узлы дерева решений соответствуют определенным результатам.

    Сформируем для нашего дерева платежную матрицу:

      x1 x2 x3 x4 x5
    В1 С11 С12 С13 С14 С15
    В2 С21 С22 С23 С24 С25
    В3 С31 С32 С33 С34 С35
    В4 С41 С42 С43 С44 С45
    В5 С51 С52 С53 С54 С55

    Выбор конкретного варианта на данной матрице осуществляется с использованием рассмотренных выше методов (критериев) ПР.

    Проиллюстрируем построенное дерево и платежную матрицу следующим примером:

    В1 — нормальный образ жизни (без вредных привычек);

    В2 — неумеренное потребление алкоголя;

    В3 — курение;

    В4 — алкоголь и курение;

    В5 — употребление наркотиков;

    x1 — смерть от сердечно-сосудистых заболеваний;

    x2 — смерть от онкологических заболеваний;

    x3 — смерть от несчастного случая;

    x4 — смерть от СПИДа;

    x5 — смерть от других причин;

    сij — количество лет жизни от момента, когда вредная привычка сформировалась.

    Очевидно, что в платежной матрице для данного примера имеет место явное доминирование варианта В1.

    Рис. 25. Дерево решений

    Вопросы для самостоятельной работы

    1. На основе приведенных ниже платежных матриц выбрать лучший вариант, используя соответствующий критерий.

    Матрица № 1 Матрица № 2
      x1 x2 x3     x1 x2 x3
    В1 5 9 3   В1 50 7 3
    В2 10 7 1   В2 11 4 20
    В3 1 6 5   В3 7 12 15
    В4 2 20 0   В4 0 15 10

    Матрица № 3 Матрица №4
      x1 x2 x3 x4     x1 x2 x3
    В1 8,5 0 1 4   В1 -10 -12 0
    В2 0 0 10 0   В2 -2 -12 2
    В3 1 1 5 5   В3 0 -12 0
    В4 4 4 3 3   В4 -1 12 -6

    Матрица №5 Матрица № 6
      x1 x2 x3     x1 x2 x3 x4
    В1 5 8 1   В1 0,5 1 -0,5 2
    В2 10 2 0   В2 2 2 0 -1
    В3 0 4 6   В3 4 0 -0,8 1
    В4 1 20 -4   В4 0 0 2 1,5

    Матрица №7 Матрица №8
      x1 x2 x3     x1 x2 x3
    В1 100 5 20   В1 1 1 100
    В2 20 110 50   В2 1,1 10 1,1
    В3 40 80 10   В3 2 1,2 0
    В4 0 200 0   В4 8 2 0

    Матрица № 9 Матрица № 10
      x1 x2 x3     x1 x2 x3 x4
    В1 2 10 2   В1 -1 7 2 -1
    В2 4 0 8   В2 10 -2 0 0
    В3 6 0 6   В3 0 -3 8 4
    В4 8 2 0   В4 -5 5 -5 15

    2. На примере конкретной платежной матрицы определить риск при принятии решений.

    3. Привести пример и построить для него дерево событий.

    4. Привести пример и построить для него дерево решений.

    5. Сформировать платежную матрицу, в которой один из вариантов явно доминирует над остальными.

    5. Многокритериальные задачи принятия решения

    5.1. Свойства задач принятия решения со многими критериями

    В технической практике задачи ПР с учетом нескольких критериев возникают достаточно часто. Сложность подобных задач существенно выше, чем при наличии одного критерия. Если при этом еще учитывать и неоднозначность внешних воздействий, то для получения корректного результата кроме математических знаний необходим также и опыт в соответствующей предметной области.

    Теоретически можно представить случай, когда во множестве окажется одна альтернатива, для которой все r критериев (целевых функций) принимают наибольшие значения (в предположении, что все критерии максимизируются). Естественно, что данная альтернатива и будет наилучшей. К сожалению, на практике такие ситуации практически не встречаются, а типичным является случай, представленный на рис. 26, для двух целевых функций.

    Рис. 26. Ситуация ПР для двух критериев

    При Х* максимума достигает одна целевая функция, а при Х** – другая; нам же предстоит сделать только один выбор. Очевидно, что ППР здесь становится менее прозрачным.

    Сформулируем некоторые очевидные положения для подобных ситуаций:

    1. Не существует результата наилучшего в абсолютном смысле.

    2. Решение может считаться лучшим лишь для конкретного ЛПР, с учетом его предпочтений.

    3. Для нахождения приемлемого результата должна строиться многокритериальная модель, которая создается для уточнения предпочтений ЛПР. Она должна быть логически непротиворечивой и должна включать в себя основные свойства решаемой задачи.


    5.2. Формирование множества критериев

    Количество критериев должно охватывать все особенности задачи. Число критериев считается полным и достаточным, если прибавление нового критерия не изменит результата решения, а отбрасывание критерия этот результат меняет. Все критерии не должны сильно коррелировать друг с другом. Степень корреляции между μ и ν критериями можно определить по следующей формуле:

    где

    где Хi – случайная альтернатива из множества , i=1, …, N; fμ(Хi), fν(Хi)– критерии; N – число случайных испытаний.

    Если Кmv приближается к 1, то это свидетельствует о сильной корреляции критериев. Тогда необходимо рассмотреть вопрос об исключении одного из критериев.

    Каждому критерию может быть поставлена в соответствие своя координатная ось и шкала. Последняя может быть непрерывной или дискретной, количественной или качественной. Каждую ось будем обозначать буквой Zv, v=1, 2, …, r. Z1 х Z2 х...х Zn – декартово произведение, которое формирует пространство критериев, где имеет место множество векторных оценок. Между пространством параметров и пространством критериев существует соответствие (рис. 27).

    Рис. 27. Пространства параметров и критериев

    Здесь D – допустимая область;– аналог допустимой области в пространстве критериев.


    5.3 Методология решения многокритериальных задач

    При решении многокритериальных задач обычно задаются параметрические ограничения вида xi minxi xi mах , при i=1, 2, …, n, которые формируют в пространстве параметров n-мерный параллелепипед (рис. 28, а). Далее предполагается, что заданы функциональные ограничения вида pi (x) 0, при j=1, 2, …, m, которые вырезают в параллелепипеде некоторую часть D, состоящую из точек Х, удовлетворяющих одновременно параметрическим и функциональным ограничениям. В разделе 2 эту часть пространства мы называли допустимой областью (ДО). Множество D может оказаться весьма сложным, например, состоящим из нескольких отдельных частей (рис. 28, б, закрашенные участки).

    Наконец, предполагается, что заданы соответствующие критерии fν(Хi),ν =1, 2, …, r. Для определенности здесь будем считать, что критерии f1, …, fr желательно уменьшить.

    Предположим, что ЛПР сумел указать разумные критериальные ограничения вида fν(Х) , при =1, 2, …, r. При этом – значение для одной из линий равного уровня n-го критерия.

    Очевидно, – это наихудшее значение критерия , на которое ЛПР может согласится. Обозначим через G множество точек Х, которые удовлетворяют параметрическим, функциональным и критериальным ограничениям. Понятно, что GD (рис. 28, в, закрашенные области).

    а)

    б)

    в)

    Рис. 28. Формирование параметрическими (а), функциональными (б)и критериальными (в) ограничениями области поиска экстремума

    Наилучшее решение целесообразнее искать среди точек множества G, а не среди точек множества D, поскольку, если точка ХG, то значения всех критериев в этой точке приемлемы. Понятно, что завышенные требования ЛПР могут привести к G=0, т.е. область поиска решений окажется пустой.

    Введем понятие эффективных точек. Точка Х считается, безусловно, лучше точки Х', если fν(Х) fν(Х')при всех ν=1, 2, …, r , и существует хотя бы одно значение ν0, такое, что fν0(Х) < fν0(Х').

    Точка Х называется эффективной, если не существует ни одной точки, безусловно, лучшей, чем Х. Обозначим через Е множество эффективных точек, принадлежащих D. Если ЛПР по каким-то соображениям не использует критериальные ограничения, то тогда наилучшее решение целесообразно искать среди точек множества Е.

    Выше множество точек Z, соответствующих точкам Х, принадлежащим D, мы обозначили через . Теперь множество точек Z, соответствующих всем точкам Х, принадлежащим Е, обозначим через Ẽ. Полученное таким образом множество Ẽ называется множеством Парето. Множество Парето в случае двух критериев представляет собой компромиссную кривую. Это множество всегда располагается на границе множества (рис. 29). Оптимальность по Парето означает, что нельзя дальше уменьшать значение любого из критериев, не увеличивая значение хотя бы одного из остальных.

    Рис. 29. Область Парето

    Для пояснения изложенного рассмотрим простейший метод, позволяющий приближенно находить множество Парето для случая двух критериев. На рис. 30, а построена область возможных значений в плоскости двух критериев. Исключение неэффективных точек в этом случае очень наглядно. Исключению подлежат все точки, образы которых в плоскости (z1, z2) расположены одновременно правее и выше образа исходной точки. В случае многих критериев геометрическая интерпретация аналогична.

    После исключения неэффективных точек осталось всего 9 приближенно эффективных точек. Соединив их, получим приближенную компромиссную кривую Ẽ', которая вместе с точной компромиссной кривой Ẽ построена на рис. 30, б. В качестве наилучшей среди исходной совокупности точек следует выбрать одну из этих 9 точек.

    а)

    б)

    Рис. 30. Построение области Парето


    5.4. Методы принятия решения при нескольких критериях

    При необходимости ПР при многих критериях на практике обычно используют следующие подходы.

    Свертка векторного критерия

    Этот метод также называют скаляризацией векторного критерия или введением суперкритерия. Суть его заключается в следующем.

    Выбираются коэффициенты βi ≥ 0 так, что функция   или  "обобщила в себе" все требования частных критериев . При этом обычно , и каждый  βν  характеризует степень важности критерия (X).

    На практике обычно ЛПР выбирает какие-то β1, …, βr , затем отыскивает наилучшую точку Х' – например, минимум S(X') при Х'D. Если при этом оказывается, что некоторые из значений ЛПР не удовлетворяют, тогда он корректирует значения β1, …, βr и решает задачу заново и т.д.

    Рассмотренный подход также называют аддитивной сверткой. Он имеет существенный недостаток – трудно находить коэффициенты βν  из-за разных размерностей критериев.

    Этого недостатка лишена свертка вида:

    или

    где – идеальное (реально недостижимое) значение ν-го критерия, которое указывается ЛПР; – наименее предпочтительное для ЛПР значение ν-го критерия; μν , ρν– весовые коэффициенты с тем же смыслом, что и βν.В двух последних свертках каждый ν-й критерий выступает своим нормализованным значением , которое изменяется в пределах от 0 до 1. Данный подход снимает проблемы, обусловленные неодинаковыми размерностями входящих в свертку критериев.

    Однако существуют и другие вопросы. В частности, можно показать, что выбор вида свертки влияет на конечный результат.

    Для иллюстрации данного утверждения рассмотрим случай двух критериев Z1 и Z2 и предположим, что они оба получили одинаковые "веса": μ1 = μ 2 =0,5 и ρ1 = ρ2 =0,5 . Пусть допустимая область в пространстве критериев имеет вид, представленный на рис.31 а. Для интегрального критерия типа S1 линии равного уровня представляют собой прямые, задаваемые уравнениями:

    На рис. 31б они показаны в виде линий АВ и A'B'. Для интегрального критерия типа S2 линии равного уровня – окружности с центром в точке , которые описываются уравнением вида:

    Из рис. 31б видно, что первый тип рассматриваемой свертки предполагает выбор в качестве результата точки А или В; второй – точку С. Очевидно, что все три результата существенно отличаются друг от друга.

    Оптимизация главного из нескольких критериев

    При таком подходе один из критериев, наиболее важный с точки зрения ЛПР, оставляют в качестве единственного критерия, а все остальные заменяют ограничениями.

    Пусть для определенности главным критерием считается f1(X). Тогда следует выбрать ограничения и рассмотреть задачу об отыскании минимума f1(X) при дополнительных ограничениях

    При таком подходе возникает проблема выбора критериальных ограничений , что может потребовать выполнения специальных предварительных расчетов.

    а)                                                    б)

    Рис. 31. Иллюстрация влияния вида свертки на конечный результат: а – допустимая область;  б – линии равного уровня для критерия S1 (прямые) и S2 (окружности)

    Последовательная оптимизация всех критериев

    Сначала определяется минимальное значение f1(Х) при XD. Обозначим его через . Выбираем "уступку" по этому критерию h1 и назначаем критериальное ограничение . Затем находится минимальное значение f2(Х) при XD и дополнительном ограничении . Получив значение и выбрав "уступку" h2, назначаем второе критериальное ограничение . После этого определяется минимальное значение f3(Х) при XD, и и т.д.

    На последнем шаге требуется найти минимальное значение fr(X) при XD, ,  . Если  реализуется в точке Х*, то эта точка считается наилучшей..

    Очевидно, что точка Х* зависит и от порядка нумерации критериев, и от выбора h1, …, hr-1. Кроме того, всегда остается сомнение в том, что выбрав какую-либо из уступок несколько большей, мы смогли бы существенно улучшить значения других критериев.

    Все три метода нуждаются в дополнительной информации: в первом – это коэффициенты β1, …, βr; во втором – номер главного критерия и значения ограничений ; в третьем – порядок выбора критериев и величины уступок h1, …, hr-1.

    Вопросы для самостоятельной работы

    1. Чем многокритериальный процесс принятия решений отличается от однокритериального?

    2. Как "предпочтения ЛПР" влияют на результат многокритериальной задачи принятия решений?

    3. Для принятия решений используются три критерия. Коэффициенты корреляции соответственно равны k12=0,3; k13=0,94; k23=0,78. Какой вывод можно сделать?

    4. Объяснить сходство и различие между областью G и множеством Парето.

    5. В процессе принятия решений получено множество Парето, содержащее 15 вариантов, каждому из которых соответствует эффективная точка в пространстве критериев. Ваши дальнейшие действия?

    6. Приведите пример принятия решений из предметной области специальности "Безопасность жизнедеятельности в техносфере", содержащий два критерия. Нарисуйте блок-схему алгоритма решения данной задачи.

    7. Какой результат будет получать ЛПР, если при многократном решении многокритериальной задачи он будет использовать:

    - в одном случае один вид свертки, а в другом — другой;

    - в одном случае одни весовые коэффициенты в одной и той же свертке, а в другом — значения весовых коэффициентов изменяются.

    8. Два ЛПР независимо друг от друга решают одну и ту же задачу ПР с двумя критериями последовательно их оптимизируя. Первый — выбирает "уступку" h1, а второй — 10h1. Кто из них прав и почему?

    6. Некритериальные методы принятия решения

    6.1 Бинарные отношения

    Это более общий подход по сравнению с критериальным. Он основан на отказе от присваивания каждой альтернативе конкретной оценки, что в реальности иногда затруднительно. Вместо этого любая альтернатива рассматривается не в отдельности, а в паре с другой альтернативой, что позволяет выявить какая из них более предпочтительна.

    Таким образом, для каждой пары (х, у) некоторым образом можно установить предпочтительность, равноценность или несравнимость.

    Математически бинарное отношение R на множестве определяется как некоторое подмножество упорядоченных пар (х, у). Обычно используют обозначение хRу, если х находится в отношении R к у, и  в противном случае. Задать отношение – это значит тем или иным способом указать все пары (х, у), для которых выполнено отношение R. Это возможно посредством перечисления всех пар (х, у)R, задания матрицы или графа предпочтения и некоторыми другими способами.

    В следующих разделах на конкретном примере будет рассмотрен так называемый метод "Электра", который может применяться при сопоставлении конечного множества объектов таких, как кандидаты в конкурсе на замещение вакантной должности, поставщики оборудования, марки определенного вида продукции, виды работ и др.

    6.2. Проблемы сравнения

    Пусть имеются шесть объектов, которые образуют множество Е={е1,е2,е3,е4,е5,е6} . Пусть также имеется некоторый набор критериев Zi, i=1, …, n. Обозначим через Ki множество оценок, которые можно получить, рассматривая элементы множества Е с точки зрения критерия Zi. Таким образом, с каждым элементом еЕ сопоставляется значение декартова произведения

    K=K1*K2*…*Kn.

    Выбранная процедура оценок дает возможность присвоить каждому еЕ только одно определенное значение γi(е)Ki.

    Совокупность оценки γi позволяет построить на множестве Е ориентированный граф Gi=(E, Ui), если положить

    (е, е') Uiγi (е) γi'),

    где обозначение (е, е') используется для представления ориентированной дуги, идущей из элемента е в элемент е', а Ui – множество дуг графа Gi; при этом ориентированная дуга направлена от элемента с более высокой оценкой к элементу с более низкой оценкой; равенство оценок для двух элементов влечет наличие двух противоположно направленных дуг (е, е') и (е', е); знак  означает "не менее предпочтительно, чем".

    Возьмем для сравнения наших объектов пять критериев. Оценку γi(е),  i=1, 2, …, 5  каждого элемента еЕ будем производить с помощью шкалы следующего вида:

    Ориентированный граф Gi строится посредством попарного экспертного сопоставления всех элементов для каждого i-го критерия. В вершинах каждого графа проставляется оценка γi(е), присвоенная элементу е по шкале Ki (рис. 32).

    6.3. Индексы согласия и несогласия

    Рассмотрим два произвольных объекта е, е'Е. Применительно к каждой паре множество используемых критериев может быть разбито на два класса. К первому классу, С (е, е'), отнесем все те критерии Zi, для которых γi(е) γi(е'), т.е. критерии, согласно которым в графе Gi должна иметь место дуга (е, е'), ведущая из е в е'.

    Остальные критерии, согласно которым, напротив, имеет место отношение (е', е), образуют второй класс – D (е, е').

    Здесь нам придется решить вопрос о ранжировании критериев, т.е. установлении меры их относительной важности, для чего используем коэффициенты сi, при этом: 

    .

    О степени "согласия" в пользу "превосходства" е над е' можно судить по значению индекса согласия С (е, е'), который определяется следующим образом:

    Рис. 32. Сравнение объектов е1, …, е6 по пяти критериям

    Пусть при ранжировании критериев Zi, i=1, …, 5 были использованы следующие коэффициенты: с1=3; с2=2; с3=3; с4=1; с5=1, тогда матрица согласия будет иметь вид:

    Проиллюстрируем способ получения значений в приведенной матрице для первого столбца. Из рис. 32 видно, что элемент е1 превосходит е2 по первому, второму, третьему и пятому критериям, т.к. от е1 к е2 проведены дуги. Поскольку "веса" этих критериев нам известны, рассчитаем индекс согласия:

    Для последнего значения первого столбца матрицы С будем иметь:

    т.к. превосходство е1 над е6 достигается только по второму ("вес" 2) и пятому ("вес" 1) критериям. Знаменатель в предыдущих расчетах определяется суммированием "весов" всех критериев.

    Расчет индекса несогласия осуществляется по формуле:

    где d – максимально возможная разность оценки по каждой из шкал.

    Для расчета этого индекса необходимо ввести понятие репера, т.е. числового значения для выполнения процедуры оценивания. Введем реперы для нашего примера:

    критерии 1, 2, 3: ε=0; п=5; у=10; х=15; о=20;

    критерии 4, 5: ε=4; п=7; у=10; х=13; о=16.

    Теперь можно сформировать матрицу несогласия:

    Проиллюстрируем процесс ее построения. Сначала определим d. Поскольку по трем шкалам (для критериев 1, 2, 3) разность оценки –20 превышает разность 12 (для критериев 4, 5), то d=20. Теперь возьмем первый столбец и элемент d (е1, е2). Из рис. 32 видно, что анализ должен производиться для 3-го и 4-го критериев:

    - для 3-го имеем обе оценки "плохо" и, следовательно, 5–5=0;

    - для 4-го разность между оценками "отлично" и "удовлетворительно" определяется, как 16–10=6.

    Тогда

    Теперь определим d (е2, е1). Анализируем 1, 2, 3 и 5-й критерии:

    - для 1-го ε-у=0-10=10 (берется абсолютное значение);

    - для 2-го п-о=5-20=15;

    - для 3-го п-п=0;

    - для 5-го у-о=10-16=6.

    Теперь

    Определим еще

    Индексы согласия и несогласия изменяются от 0 до 1.

    6.4. Отношение превосходства

    Введем в рассмотрение два числа, расположенные между 0 и 1. Одно из них, р, будем выбирать близким к 1, а второе, q – к 0. Эти числа будем называть пороговыми значениями.

    Говорят, что объект е превосходит объект е' тогда и только тогда, когда для рассматриваемой пары (е, е'):

    - индекс согласия не меньше р;

    - индекс несогласия не больше q.

    Определенное таким образом отношение превосходства представляется графом G (p, q). Граф вида G (1, 0) называется предельным. На основании полученных нами матриц С и D можно построить предельный граф для нашего примера (рис. 33).

    Рис. 33. Предельный граф

    Из анализа рис. 33 можно сделать вывод, что е6, безусловно, лучше е5 и е4, а е5 лучше е4. Другие значения порогов дают новые отношения превосходства, что иллюстрируют соответствующие графы (рис. 34).

    Рис. 34. Примеры отношений превосходства

     

    Вопросы для самостоятельной работы

    1. Дать понятие бинарного отношения. Привести примеры.

    2. При принятии конкретного решения ЛПР приходится сравнивать три объекта по четырем критериям. Нарисовать ориентированные графы, произвольно выбирая направления дуг. Проставить оценки, проранжировать критерии и составить матрицу согласия.

    3. Дать понятие и объяснить механизм вычисления индекса согласия.

    4. Дать понятие и объяснить механизм вычисления индекса несогласия.

    5. Что такое "репер"?

    6. В каком интервале изменяются индексы согласия и несогласия?

    7. Объяснить смысл графов G(1;0) и G(0,5;0,5). Чем они отличаются друг от друга в плане принятия решений?

    7. Групповой выбор

    7.1. Особенности группового выбора

    В реальных условиях возникают ситуации, когда несколько человек с одинаковыми намерениями стремятся найти хорошее решение. Такой процесс носит название группового выбора. Пусть на множестве альтернатив задано n различных индивидуальных предпочтений R1, R2, …, Rn. Ставится задача о выработке некоторого нового отношения R, которое выражает в каком-то смысле "общее мнение" и принимается за групповой выбор.

    Распространенным способом получения отношения R является процедура голосования. В этой процедуре основным принципом является правило большинства: принятой всеми считается альтернатива, получившая наибольшее число голосов. Правило большинства привлекательно своей простотой, но имеет некоторые особенности. Дело в том, что оно лишь обобщает индивидуальные предпочтения, и его результат не является критерием истины. Только дальнейшая практика показывает, правильным или ошибочным было решение, принятое большинством голосов. Большинство здесь понимается – или как простое большинство (>50 %), или как «квалифицированное» (>2/3), или как абсолютное (~100 %).

    Другая особенность голосования – невозможность выбора из-за недостижения требуемого большинства. Например, пусть три эксперта большинством голосов решают вопрос, какая из двух альтернатив более предпочтительна. При такой постановке вопроса они не могут не сделать выбор.

    Но, предположим, эти эксперты предлагают свои варианты развития некоторой системы a, в и с соответственно. Каждый эксперт руководствуется при этом собственным набором предпочтений. Пусть это последовательности а>в>с, в>с>а, с>а>в.

    После голосования по паре (а, в) в результате получается два голоса против одного: а>в; по паре (в, с) в>с и по паре (с, а) с>а, также с перевесом двух голосов против одного. Таким образом, голосование не привело к выяснению "общепризнанного" порядка альтернатив, поскольку в результате а>в>с>а.

    Причина данного явления называется парадоксом нетранзитивности группового выбора. Она объясняется цикличностью совокупности индивидуальных предпочтений. Однако это лишь частный пример более общего явления, получившего название парадокса Эрроу, смысл которого в следующем.

    Выделим требования, выражающие наше понимание того, какой выбор можно считать согласованным:

    1) если в результате группового выбора предпочтение было отдано альтернативе х, то это решение не должно меняться, если кто-нибудь из ранее отвергавших х изменил свое предпочтение в ее пользу (условие монотонности);

    2) если изменения индивидуальных предпочтений не коснулись определенных альтернатив, то в новом групповом упорядочении порядок этих альтернатив не должен меняться (условие независимости альтернатив);

    3) для любой пары альтернатив х и y существует такой набор индивидуальных предпочтений, для которого х>y (условие суверенности);

    4) не должно быть такого эксперта, для которого из его предпочтения х>y вытекает, что R=(х>y), независимо от предпочтений других экспертов (условие отсутствия диктаторства).

    Парадокс Эрроу состоит в том, что первые три условия противоречат четвертому; не существует правила R, удовлетворяющего всем требованиям.

    Задачи группового выбора часто все же могут быть разрешены. Во-первых, в ряде случаев циклические ранжирования могут отсутствовать либо они не охватывают «наиболее важные» альтернативы, либо принимаются меры по их обнаружению и устранению. Во-вторых, во многих ситуациях "диктаторский" принцип согласования может оказаться приемлемым. В-третьих, переход (когда это возможно) к использованию единой числовой, а не порядковых индивидуальных шкал предпочтений может вообще устранить проблему нетранзитивности.

    7.2. Экспертные методы выбора

    Основная идея экспертных методов состоит в том, чтобы использовать интеллект людей, их способность искать и находить решение слабо формализованных задач. В методиках организации экспертных оценок внимание уделяется созданию благоприятных условий и нейтрализации факторов, неблагоприятно влияющих на работу экспертов.

    Очень важную роль при этом играют факторы психологического характера. Прежде всего эксперты должны быть освобождены от ответственности за результат экспертизы. Дело не только в том, что ЛПР не должно возлагать ответственность на других, но и в том, что сама ответственность накладывает психологические ограничения на характер выбора, а этого на стадии оценки альтернатив желательно избежать. Приходится также учитывать, что оценка, даваемая экспертом, может зависеть от межличностных отношений с другими экспертами и иногда от того, известна ли его оценка другим лицам. На ход экспертизы может повлиять и личная заинтересованность эксперта, т.е. его необъективность.

    С другой стороны, сложность проблемы обычно выходит за рамки возможностей одного человека, а коллективная деятельность обычно открывает дополнительные возможности для взаимного стимулирования экспертов.

    В разных случаях используют методики экспертиз, имеющие различные степень и характер взаимного влияния экспертов друг на друга: анонимные и открытые опросы и анкетирование, совещания, дискуссии, деловые игры, мозговой штурм и т.д.

    Рассмотрим простейший вариант. Экспертам раздают анкеты с просьбой оценить предлагаемые альтернативы. Заполненные анкеты собирают, обрабатывают и полученную информацию в некотором обобщенном виде передают ЛПР.

    Предположим, что эксперты оценивают альтернативы в числовых шкалах. Пусть Zj(Xi) – оценка i-и альтернативы j-м экспертом (i=1,…, n; j=1, …, m). Оценки Z1(Xi), … Zm(Xi) можно рассматривать как «измерения» искомой «истинной» характеристики Z(Xi). В качестве приближения можно использовать выборочное среднее

    Сложнее обстоит дело, когда альтернативы нельзя оценить сразу одним числом и экспертам предлагается дать оценки отдельно по каждому показателю. Например, оценка качества электроэнергии складывается из оценок несимметричности фаз, несинусоидальности токов, отклонений частоты от номинальной. В таких случаях имеем набор чисел Zjk (Xi ), где k – номер признака. Кроме этих чисел экспертов просят оценить степень важности λjk каждого показателя. Тогда

    Естественно придать различные приоритеты («веса») мнениям экспертов, имеющих разную квалификацию. Определение коэффициента аi компетентности j-го эксперта можно поручить самим экспертам. Пусть каждый из них (l-й) оценивает компетентность других экспертов числами 0аlj1, при этом и свою собственную числом all .

    Усреднение дает

    В результате получают итоговую оценку

    В тех случаях, когда эксперты лишь упорядочивают альтернативы, т.е. используют только порядковую шкалу, необходимость арифметических операций отпадает.

    7.3. Метод Делфи

    Основная идея метода заключается в том, что критика положительно влияет на эксперта, если она не связана с персональной конфронтацией. Поэтому если проводить оценку альтернатив в несколько туров, сообщая после каждого его полные итоги и сохраняя анонимность участников, то эксперты склонны не только критиковать, но и прислушиваться к критике, относящейся к ним лично. Устранение психологических трудностей, связанных с персональной критикой, придает самой критике большую деловитость и объективность, она легче воспринимается. Все это способствует тому, что обычно оказывается достаточно проведения следующих этапов:

    1) раздача анкет, сбор оценок, их обобщенное представление с указанием разброса мнений;

    2) сообщение итогов и запрос объяснений причин индивидуального отклонения от средней оценки первой итерации;

    3) заслушивание всех объяснений и запрос контраргументов на них;

    4) заслушивание возражений и запрос новых оценок альтернатив, если эксперты пожелают их изменить;

    5) подведение окончательного итога.

    Вся работа выполняется под руководством системного аналитика и ЛПР. Анонимность экспертов сохраняется до конца работы, а по желанию экспертов – и после ее окончания.

    Метод Делфи показал на практике высокую эффективность.

    7.4. Ограничения человеческого интеллекта

    Помощь экспертов при принятии решений в сложных ситуациях неоценима. Однако существуют естественные пределы человеческих способностей при восприятии и обработке информации. Работу экспертов лимитируют не только межличностные отношения, но и внутренние психологические и физиологические причины. Оказывается, человек одновременно может оперировать лишь небольшим числом операндов (понятий, идей, моделей, альтернатив и т.д.). Психологи, говоря о пределе возможностей человека, иногда называют это законом «семь плюс-минус два». Кроме того, столкнувшись с очень сложной задачей, эксперт иногда проявляет непостоянство, неуверенность, нелогичность, стремление к резкому ее упрощению. Наконец, в ряде случаев играет роль и низкое быстродействие нервной и мышечной систем человека.

    Во всех этих отношениях возможности ЭВМ превосходят способности человека, и возникает простая, но очень плодотворная идея создания единой системы, которая объединила бы возможности человека и машины и компенсировала их недостатки.

    Вопросы для самостоятельной работы

    1. Что собой представляет групповой выбор?
    2. Объяснить смысл и трудности, возникающие при реализации процедуры голосования.
    3. Каким образом обеспечивается эффективность экспертных методов принятия решений?
    4. В чем состоят особенности методики анкетирования при выработке решения?
    5. Объяснить алгоритм метода Делфи.
    6. Каким образом особенности человеческого мышления влияют на принятие решений?

    8. Поддержка процесса принятия решения

    8.1. Характеристика составляющих симбиоза «человек-машина»

    Во всех рассмотренных выше ППР для получения результата предполагалось использование компьютера. При этом его задача заключалась, как правило, в выполнении трудоемких расчетов.

    В современных системах поддержки принятия решений (СППР) обеспечивается эффективная связь (симбиоз) человека и компьютера, предполагающая использование наиболее сильных качеств каждого участника этого процесса (табл. 3).

    Таблица 3

    Характеристика составляющих симбиоза «человек-машина»

    Человек Компьютер
    1 Способен реагировать на неожиданные события Трудно составить программу, реагирующую на все случайные события
    2 Хорошо обучается Эффективность обучения определяется программистом
    3 Плохо хранит информацию Хранит информацию в любых объемах неограниченное время
    4 Ограничена пропускная способность Пропускная способность не имеет ограничений
    5 Часто ошибается Функционирует безошибочно
    6 Не может решать одновременно несколько задач Возможность решения нескольких задач имеется
    7 Медленно считает Скорость неограниченна
    8 Снижает работоспособность со временем Работоспособность постоянна
    9 Теряет терпение Работает как автомат
    10 Может накапливать знания, не изменяя мышления и не забывая известные факты Изменение любой части информации влияет на ее общую структуру
    11 Выбирая нужную информацию, автоматически подключает относящиеся к делу факты, не перебирая все известные знания Не может выделять наиболее актуальную информацию

    Программной основой СППР являются экспертные системы.

     

    8.2. Понятие экспертных систем

    Экспертная система  —  это программа, ориентированная на решение плохо формализованных задач в определенных предметных областях на уровне специалистов-экспертов.

    При работе экспертных систем:

    - выдвигаются и проверяются гипотезы;

    - вырабатываются новые данные и знания;

    - формируются запросы на ввод новых данных;

    - формируются выводы и рекомендации.

    Плохо формализованные задачи обладают следующими характеристиками:

    - не могут быть заданы только в числовой форме;

    - цели не могут быть представлены в терминах точно определенной целевой функции;

    - не существует четкого алгоритма решения задачи;

    - исходные данные неполны и неоднозначны.

    Структура ЭС представлена на рис. 35

    Рис. 35. Типовая структура экспертной системы

    В базе знаний хранятся так называемые правила, под которыми понимаются логические и алгоритмические выражения (операции).

    Машина вывода — программа, которая формирует последовательность логических и вычислительных операций в алгоритм, на основе которого обеспечивается получение результата.

    Подсистема объяснений — формирует трассу, т.е. алгоритм в виде набора правил, позволяющих ЛПР понять, как получен результат.

    Подсистема приобретения знаний — обеспечивает диалог с экспертами, отбор и формализацию знаний.

    Подсистема взаимодействия с объектом может отсутствовать, как и сам объект.

     

    8.3. Проблемы общения с ЭС

    Существуют разные формы общения ЛПР с ЭС:

    1. Использование табличного языка.
    2. Диалог в форме меню.
    3. Диалог на естественном языке.

    Последняя форма общения предполагает высокий уровень ЭС и пока встречается редко.

    Для использования естественного языка необходима достаточно сложная программа-анализатор, которая выполняет функции:

    - лексического анализа;

    - синтаксического анализа;

    - семантического анализа.

    В современных ЭС общение с ЛПР ведется с помощью табличного языка (постановка задачи) и меню (уточнение задачи в процессе ее выполнения).

     

    8.4. Понятие знаний

    Знания — это проверенный практикой результат познания действительности.

    Определенная предметная область содержит совокупность сведений об объектах, их связях и характеристиках. Обычно ЭС создается для конкретной предметной области.

    Существуют пять форм представления знаний (в порядке повышения степени формализации):

    1. Знание в памяти человека.
    2. Материализованные знания (статьи, книги и т.д.).
    3. Научные теории.
    4. Знания на языке представления знаний.
    5. Знания в памяти компьютера.

    Последний вид знаний формирует так называемую базу знаний.

    ЭС должна обладать способностью не только использовать знания, но и исследовать их. Практичность ЭС обусловлена:

    - возможностью ее пополнения знаниями;

    - методами преобразования знаний, содержащимися в ней.

    Интеллектуальность ЭС определяется ее способностью использовать в данный момент только относящиеся к делу знания. Такие знания называются релевантными.

    Содержание базы знаний определяет робастность ЭС, под которой понимается ее способность приходить к правильным заключениям, если часть исходных данных неверна или отсутствует.

    Знания о предметной области принято рассматривать в качестве нулевого уровня представления. Следующий, первый уровень, образуют метазнания, т.е. знания о том, как представлены знания нулевого уровня. Метазнания не содержат отсылок к знаниям нулевого уровня и поэтому не зависят от предметной области. Число уровней представления знаний может быть увеличено.

    Существуют различные модели представления знаний: предикатная, продукционная, фреймовая, на основе семантических сетей. Ниже будет рассмотрена наиболее распространенная продукционная модель знаний.

     

    8.5. Модель знаний продукционного типа

    Человеческое мышление основывается на схеме: "Если" А, "то" В. В этой схеме А – предположение (посылка), В – заключение (гипотеза).

    Определим продукцию формально Р: ЕН.

    где Р — обозначение формы представления правила (в виде продукции);

    Е — посылка, которая может быть представлена подробнее Е=е1, …, еi, …еm, где ei, i=1, 2, …, m – элементарная посылка, соединяющаяся с другими посылками пропозициональными связками;

    Н — гипотеза.

    Пропозициональные связки представлены следующими знаками:

    — «не» — логическое отрицание (в ряде случаев ставится черта над символом);

    ۸ — «конъюнкция» — логическое умножение;

     ۷— «дизъюнкция» — логическое сложение;

    — «импликация» — следование.

    Смысл этих связок виден из таблицы истинности (табл. 4), ее аргументами являются логические переменные, которые могут принимать логические значения («истина» – И, «ложь» – Л).

    Таблица 4

    Таблица истинности

    А

    В А А۸В А۷В АВ

    И

    И Л И И И

    И

    Л Л Л И Л
    Л И И Л И И
    Л Л И Л Л И

    Любую продукцию можно представить в виде «и/или» графа. Например, Р1: е1۸е2 →Н1.Граф этого выражения представлен на рис.36 а:

    а)                                                      б)

    Рис. 36. Примеры элементарных графов

    Для продукции Р2: е3۷е4→Н2 граф представлен на рис. 36, б. Как видно из рис. 36 отличие конъюнктивной вершины графа от дизъюнктивной обозначается скобочкой.

    Любая дизъюнктивная вершина может заменяться несколькими простыми продукциями, число которых равно числу составляющих посылок.

    С помощью графа «и/или» можно представить сложную логическую задачу (рис. 37):

    Рис. 37. Граф для группы продукций

    Для подтверждения Н требуется истинность е1, е2, е3 или е1, е2, е4.

    Решающим называется подграф, состоящий из вершин, достаточных для подтверждения истинности гипотезы. В данном примере два решающих подграфа (рис. 38).

    Рис. 38. Решающие подграфы

    При нескольких решающих графах можно произвести выбор наиболее эффективного для данной ситуации.

     

    8.6. Модель знаний на основе таблиц решений

    Подобная модель знаний является разновидностью продукционной модели. Таблица решений (ТР) — особая запись конечного множества продукций. ТР формально может быть представлена следующей четверкой:

    Т=<Е, H, Ẽ >.

    Е={ei}, i=1,2, …, m — множество посылок;

    Н={hr}, r =1, 2, …, k — множество гипотез;

    Ẽ=|eij|, i=1, 2, …, m; j=1,2.. n — матрица посылок;

    =|hrj|, r=1, 2, …, k; j=1,2.. n — матрица гипотез.

    Элемент eij может принимать любые значения из множества 0,1,λ: eij {0,1,λ}.

    Речь в данном случае идет о бинарных ТР:

    eij=1, когда посылка выполняется (еij — истинно);

    eij=0, когда посылка не выполняется (еij — ложно);

    eij=λ указывает на безразличие данного условия к следуемым за этим действиям.

    Обычно в таблице решений λ опускается. Матрицы Ẽ и связывают посылки (условия) и гипотезы (действия). Будем воспринимать пару <Ẽi,i> как некоторое правило Ri,i,i — векторы-столбцы соответствующих матриц.

    В полной таблице решений обязательно содержится так называемое правило "иначе", которое обозначается буквой I. Это правило состоит только из столбца действий и выполняется, если не выполнено ни одно из правил Rj.

    В качестве примера рассмотрим следующую таблицу:

    Приведенная таблица может быть заменена следующей группой продукций:

    Р1: е1, ē2→ h1;

    Р2: ē1, е2, e3→ h2;

    Р3: ē1, ē2, e3→ h2;

    Р4: ē1, ē23→ h3, h4;

    P5 – в случае, если не выполняются правила R1 – R4, тогда должно выполняться действие h5.

    На вход таблицы решений подается вектор данных S=(s1, … si, … sm), который может распознаваться или нет.

    Таблица, не содержащая столбца I, называется полной относительно входного вектора S, если выполняется следующее условие:

    ( S Rj) (S → Rj).

    Последняя запись интерпретируется так: для любого входного вектора S существует правило Rj в ТР, которое при поступлении исходных посылок (в виде вектора S) выполняется.

    Приведем пример полной таблицы решений относительно любого входного вектора:

    При наличии столбца I ТР всегда полна.

    Один вектор может запустить несколько правил. При этом различают два случая:

    1) ( S Rj Rр) ((S → Rj) ۸ (S → Rр) → (Hj ≡ Hр));

    2) ( S Rj Rр) ((S → Rj) ۸ (S → Rр) → (Hj ≠ Hр)).

    В первом случае ТР является непротиворечивой относительного входного вектора S, а во втором – противоречивой, т.к. рекомендуемые гипотезы (действия) трактуются неоднозначно.

    Пример неполной и непротиворечивой ТР:

    Пример неполной и противоречивой ТР:

    Пустые позиции в двух приведенных ТР означают, что в них содержится λ. В первой из приведенных ТР не распознаются вектора    (0, 1, 0) и (1, 1, 0), что обусловливает ее неполноту. Во второй таблице не распознается вектор (0, 1, 1, 1). Кроме того, вектор (1, 0, 0, 0) запускает два правила R1 и R5, в которых H1≠H5 (h1≠h3). В то же время, можно заметить, что вектор (1, 0, 0, 1) запускает R2 и R6, но в этом случае H2≡H6.

    Все вводимые в ЭС правила должны подвергаться анализу на непротиворечивость. Это делается с помощью специальной программы анализатора. При этом необходимо стремиться к полноте информации. Система должна содержать такой набор правил, чтобы реагировать на любую входную информацию.

    ТР может быть представлена в виде бинарного графа, внутренними вершинами которого являются условия, а терминальными – правила. Так, для самого первого примера ТР (со столбцом I) подобный граф представлен на рис. 39.

    Рис. 39. Пример бинарного графа для ТР

     

    8.7. Учет неполноты знаний

    Любые знания, как и информация вообще, характеризуются определенной неточностью (расплывчатостью). Для формализации этой особенности знаний используются разные способы. Одним из простейших является механизм коэффициентов доверия.

    Запишем продукцию в следующем виде:

    Р(Кр):Е→Н,

    где Кр – коэффициент доверия продукции, который учитывает нечеткость сформулированного правила.

    Если требуется учесть расплывчатость исходных посылок, то продукция будет иметь вид:

    Р(Кр): е1е1), …еiеi), … еmеm)→Н,

    где Кеi – коэффициент доверия i-ой посылки, i=1, 2, …, m.

    Коэффициенты доверия могут меняться в диапазоне [0, 1]. Чем больше коэффициент доверия, тем достовернее правило и соответствующая посылка.

    Если продукция конъюнктивна, то коэффициент доверия гипотезы Кн определяется по формуле:

    При дизъюнктивной продукции:

    Обычно гипотез значительно меньше, чем свидетельств, поэтому к одной и той же гипотезе может относиться несколько свидетельств. Предположим Р1 и Р2 относятся к одной и той же гипотезе. В этом случае значение Кн рассчитывается по следующей формуле:

    Кнр1Ке1р2Ке2–Кр1Ке1Кр2Ке2.

    Пусть получено три свидетельства, относящиеся к одной гипотезе. Тогда:

    Кнр1Ке1р2Ке2р3Ке3–Кр1Ке1Кр2Ке2–Кр1Ке1Кр3Ке3–Кр2Ке2Кр3Ке3р1Ке1Кр2Ке2Кр3Ке3.

    Формулы симметричны, т.е. результат не зависит от порядка поступления свидетельств.

    Рассмотрим пример, содержащий две продукции.

    Р1: если сегодня гололед и колеса "лысые", то произойдет авария.

    Р2: если скорость велика или водитель неопытен, то произойдет авария.

    Пусть в нашем примере коэффициенты доверия свидетельств (посылок) имеют следующие значения:

    Кгололед=0,9; К"лысые" колеса=0,7; Кбольшая скорость=0,5; Кнеопытность водителя=0,3.

    Что касается коэффициентов доверия самих продукций Кр1 и Кр2, то примем их равными единице. Использую первую формулу, получим:

    Кавария=1*min(0,9; 0,7)+1*max(0,5; 0,3)–1*min(0,9; 0,7)*1*max(0,5; 0,3)=0,85.

    Теперь рассмотрим более сложный пример. Предположим, что в некоторой технической системе может произойти авария (R). Граф "и/или" для этого события представлен на рис. 40.

    Рис. 40. Граф развития аварии

    Исходные посылки в графе (рис. 40) обозначим через Е1, …, Е9. Их возможная интерпретация и коэффициенты доверия приведены в табл. 5.

    Таблица 5

    Коэффициенты доверия свидетельств

    Обозначение Действие КЕ
    Е1 Температура окружающей среды больше допустимой 0.9
    Е2 Допущены ошибки в техническом обслуживании 0.3
    Е3 Датчик не сработал 1
    Е4 ... 0.8
    Е5 ... 0.9
    Е6 ... 0.6
    Е7 ... 0.8
    Е8 ... 0.7
    Е9 ... 0.6

    Пусть в базе знаний ЭС содержатся следующие правила:

    Р1(0,9): Е1→С1;

    Р2(0,7): Е2→С1;

    Р3(1): Е3→С2;

    Р4(0,9): Е4, Е5→С3;

    Р5(1): Е6→С6;

    Р6(0,7): Е7→С6;

    Р7(0,6): Е8, Е9→С4;

    Р8(0,9): С1, С2, С3→С5;

    Р9(0,8): С4→С6;

    Р10(1): С5, С6→R.

    В ряде случаев в ЭС вводится некоторый порог по коэффициенту доверия, ниже которого свидетельства не рассматриваются. Пусть в нашем случае порог равен 0,4. Тогда получим:

    Кс1=0,81;

    Кс2=1;

    Кс3=0,72;

    Кс4=0,36;

    Кс5=0,648;

    Кс6=0,82;

    КR=0,648.

    Рассмотрим подробнее алгоритмы определения Кс1 и Кс3. Поскольку свидетельство Е2 имеет низкий коэффициент доверия (<0,4), то им пренебрегаем. Тогда, Кс1р1×КЕ1=0,9×0,9=0,81. Для Кс3 имеем Кс3=min(КЕ4, КЕ5)×Кр4=min(0,8; 0,9)×0,9=0,72 и т.д.

    Таким образом, по изменению значения коэффициента доверия прогнозируемого события можно регулировать объем профилактических мероприятий по его предотвращению.

    Вопросы для самостоятельной работы

    1. Укажите виды деятельности, в которых человек пока превосходит компьютер.
    2. Назовите основные блоки ЭС и объясните их функции.
    3. Что такое "релевантные знания" и "робастная ЭС"?
    4. Как можно представлять знания?
    5. В чем преимущества использования таблиц решений?
    6. Как убедиться в правильности рекомендаций ЭС при принятии решения?
    7. Как влияет неполнота и противоречивость таблиц решений на функционирование ЭС?
    8. Каким образом таблицу решений можно сделать заведомо полной?
    9. Составить бинарный граф для двух последних таблиц решений из раздела 8.6.
    10. Каков смысл введения нижнего порога по коэффициенту доверия в ЭС? Всегда ли это оправдано?
    11. Можно ли дать объяснение верхнему порогу по коэффициенту доверия в ЭС?

     

    Заключение

    Источники опасностей, воздействующие на человека, природную среду и материальные ценности имеют естественное или антропогенное происхождение. Мир опасностей в начале XXI века достиг своего наивысшего развития. Ухудшение здоровья и гибель людей требуют от государства и общества приоритетного отношения к проблемам безопасности своего населения. Для этого должен быть задействован весь научно-технический потенциал, использованы имеющиеся у государства стратегические резервы. Иначе к 2050 г. в России численность населения может сократиться почти вдвое; ей грозит утрата значительных территорий и природных богатств.

    Эффективность принимаемых решений на всех уровнях руководства страны, а также каждым человеком в обыденной жизни имеет первостепенное значение. Суммируясь, негативные решения стремительно приближают страну к полному краху, в то время как решения, взвешенные и исключительно ответственные способны вывести Россию из того бедственного состояния, в котором она оказалась.

    Если после ознакомления с материалом учебного пособия читатель проникнется ощущением ответственности выбора при принятии решений для себя самого, своего окружения, организации, где он учится или работает, своей страны, то автор будет считать свою задачу выполненной.

     

    Библиографический список

    1. Александров Е.А. Основы теории эвристических решений. М.: Советское радио, 1975. – 254 с.
    2. Белкин А.Р., Левин М.Ш. Принятие решений: комбинаторные модели аппроксимации информации. М.:, 1990. – 160 с.
    3. Белов П.Г. Теоретические основы системной инженерной безопасности. – М.: МИБ СТС, 1996.– 424 с.
    4. Воропай Н.И. Теория систем для электроэнергетиков. – Новосибирск: Наука, 2000. – 272 с.
    5. Киселев В.Ю. Экономико-математические методы и модели. Иваново: ИГЭУ, 1998. – 384 с.
    6. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. М.: Наука, 1996. – 208 с.
    7. Мушик Э., Мюллер П. Методы принятия технических решений. – М.: Мир, 1990. – 206 с.
    8. Руа Б. Классификация и выбор при наличии нескольких критериев (метод Электра). – В кн.: Вопросы анализа и процедуры принятия решений. М.: Мир, 1976, С. 80-107.
    9. Химмельблау Д. Прикладное нелинейное программирование. – М.: Мир, 1975. – 534 с.
    10. Эддоус М., Стэнсфилд Р. Методы принятия решений. М.: ЮНИТИ, 1997. – 590 с.
    11. Экология и безопасность жизнедеятельности / Д.А. Кривошеин, Л.А. Муравей, Н.Н. Роева и др. М.: ЮНИТИ-ДАНА, 2000.– 447 с.
      Полное содержание статьи Вы можете найти в первоисточнике
    Источник:Попов Г.В. Выбор решений и безопасность: Учеб. пособие / Иван. гос. энерг. ун-т. – Иваново. 2003. – 92 с.
    Материал размещен на www.transform.ru14.12.2005 г.
     

     

    Перейти в форум для обсуждения

      ©  TRANSFORMаторы 2004—2010


    Рейтинг@Mail.ru Яндекс.Метрика ??????????? ????