Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Лекции по базам знаний и экспертным системам - файл 1.doc


Лекции по базам знаний и экспертным системам
скачать (1259 kb.)

Доступные файлы (1):

1.doc1259kb.24.11.2011 09:16скачать

содержание
Загрузка...

1.doc

1   2   3   4   5   6   7   8   9   10
Реклама MarketGid:
Загрузка...
^

Часть II. Экспертные системы

Предпосылки возникновения экспертных систем (ЭС)


  1. Существует достаточно широкий класс задач, плохо формализуемых, для которых отсутствует корректная математическая модель или решение связано с полным перебором, но, в то же время, эти задачи успешно решаются экспертами.

  2. Проблема отчуждения знаний или создание некого информационно-переносимого источника знаний.

  3. «Математика как универсальный язык бесполезна в ИИ. Языком ИИ должен быть язык интеллектуальных программ». (М. Мински)

Схема ЭС:


Пользователь База знаний



ЭС должна не только формулировать ответ на зарос, но и объяснять, почему этот ответ корректен.

Интерфейс должен включать в себя:

  • программу грамматического разбора,

  • подсистему интерпретации выходной информации,

  • подсистему оформления результатов работы ЭС,

  • подсистему формирования выходной информации.

Доска объявлений – подсистема, демонстрирующая процесс принятия решений экспертной системой.

Доска объявлений содержит следующие основные компоненты:

  • планы (способы, которые предполагается решать),

  • заявки (потенциальные действия),

  • решения (решения текущих подзадач в системе со связями между ними).

Диспетчер управляет заявками и определяет порядок их выполнения.

Интерпретатор обеспечивает выполнение текущей заявки: определяет правила, которые могут выполняться, связывает отдельные правила между собой, вносит изменения в содержимое доски объявлений.

Компонента объяснения непротиворечивости согласовывает полученные решения и обеспечивает уверенность в том, что полученные решения разумны.

Компонента оправдания объясняет пользователю действия системы и правдоподобность полученного решения.

База знаний содержит частные знания, которые касаются конкретной предметной области, и общие знания о мире. Кроме того, БЗ содержит набор конкретных фактов, характеризующих конкретную предметную область, и базу правил, т.е. подсистему манипулирования знаниями.

Создание ЭС возможно и оправдано, если выполняются следующие требования:

  • существуют эксперты, которые решают эту задачу лучше, чем начинающие специалисты;

  • эксперты принимают согласованные решения, т.е. они сходятся в оценке предлагаемых решений;

  • эксперты способны формализовать, вербализовать, т.е. выразить на естественном языке, и объяснить используемые ими методы;

  • решение задачи требует только рассуждений, а не действий;

  • задача не должна быть слишком трудной, т.е. для ее решения эксперты должны тратить дни, а не недели;

  • предметная область задачи должна быть достаточно структурирована, т.е. возможно построение информационной модели предметной области;

  • решение задачи должно в основном упираться не на общие, а на частные знания о мире.

ЭС оправдана, если имеет место:

  • решение задачи принесет значительный эффект, например, экономический;

  • использование человека-эксперта невозможно,

  • процесс разработки ЭС значительно меньше, чем подготовка эксперта-человека.
^

Замечания по структуре


Данная структура характерна для статических систем. Для динамических систем, т.е. систем с самообучением, характерно наличие подсистемы обучения, которая генерирует новые факты и правила в базе знаний и новые планы для решения задач. Наиболее часто эта подсистема использует генетические алгоритмы и/или нейронные сети.

В разработке ЭС принимают участие следующие группы участников: эксперты (люди, чьи знания отчуждаются), инженеры по знаниям (специалисты по формализации вербализованных знаний), разработчики (программисты) (основу ЭС составляют специальные среды разработки, базирующиеся на языках логического программирования), пользователи.
^

Этапы разработки ЭС


Разработка ЭС имеет ряд отличий от разработки обычного ПО.



Идентификация – определение задач, целей и разработки, пользователей и экспертов. Решается вопрос о целесообразности и возможности создания ЭС.

Концептуализация – построение вербальной модели задачи. Проводится содержательный анализ предметной области, выявляются основные объекты и взаимосвязи между ними, определяются методы решения задач.

На этапе формализации строится формальная модель предметной области, среда разработки, способы представления всех видов знаний, фиксируются понятия, методы решения, средства представления и манипулирования знаниями.

Этап реализации включает в себя с одной стороны создание кода информационной системы, с другой стороны – наполнение экспертами БЗ. Эти процессы взаимно влияют друг на друга.

На этапе опытной эксплуатации сопоставляются решения, принятые экспертами, с результатами работы ЭС. Качество работы системы оценивается экспертами.

Тестирование соответствует этапу внедрения обычной системы. Система оценивается пользователем.
^

Пример построения ЭС.
Подход на основе теоремы Байеса.


Пусть имеется набор признаков q1,q2,…,qk. Необходимо по набору значений, признаков определить наиболее вероятную гипотезу.

Эмпирическим путем можно определить следующие параметры:

p(Si) – априорная вероятность (p) появления признака Si, не зависящая ни от чего,

p(qj/Si) – вероятность наличия j-го признака в ситуации Si – (p+),

– вероятность наличия j-го признака при условии отсутствия Si – (p).

p++p1. Признаки qi не независимы и не образуют полного разбиения вероятностного пространства. БД информационной системы (ИС) состоит из следующих наборов данных:

  1. описание признаков (j,Nj,Wj,Tj),

j – номер признака

Nj – наименование признака

Wj – вопрос, с помощью которого проверяется наличие признака

Tj – тип признака (шкала)

  1. таблица гипотез (i,Ni,Pi),

i – номер гипотезы

Ni – наименование гипотезы

Pi – априорная вероятность появления гипотезы

  1. таблица соответствия признаков и гипотез (i,j,p+,p)

i – номер гипотезы

j – номер признака

p+ – вероятность наличия j-го признака при наличии i-ой гипотезы

p – вероятность наличия j-го признака при отсутствии i-ой гипотезы

Функционирование системы сост. в последовательной проверке наличия некоторых признаков и определения наиболее вероятной гипотезы или набора гипотез.

;

p(qj)= p(qj/Si)p(Si) + p(qj/Si) p(Si) = p(qj/Si)p(Si) + p(qj/^ Si)(1 – p(Si)) – априорная вероятность при ответе «да»;

p(Si/qj)=(1-p(qj/Si))p(Si)/p(qj); p(qj) = (1-p(qj/Si))p(Si) + (1-p(qj/Si))(1- p(Si)) – априорная вероятность при ответе «нет».

Признак qi – подтверждающий гипотезу Si, если p(Si/qj)p(Si). Тогда для любой гипотезы можно подсчитать – max возможная апостериорная вероятность гипотезы Si, т.е. вероятность, которая получается при ответах «Да» на все подтверждающие вопросы и при ответах «Нет» на опровергающие вопросы.

– min возможная апостериорная вероятность (текущие оценки).

Очевидно, что для того, чтобы система была корректной, допустимые интервалы для любой гипотезы должны пересекаться. Это значит, если возникает ситуация , то система некорректна, т.к. это значит, что гипотеза Si никогда не может быть принята.



Замечание 1:

Точная оценка вероятности весьма затруднительна, т.к. множество всех гипотез может быть весьма большим. Если мы уверены, что гипотезы S1,…,Sk образуют полное пространство гипотез, то для оценки можно воспользоваться формулой полной вероятности.

Замечание 2:

Подход корректен при условии, что множество всех признаков независимо, т.к. на практике обеспечить независимость признаков практически невозможно, а нас волнует не точное значение вероятностей, а их минимальный порядок, то при разработке системы стремятся обеспечить равномерную ошибочность оценок вероятностей всех гипотез.

В случае, если используется признак с ответом в форме шкалы, для получения апостериорной вероятности используется минимальная интерполяция.

В каждый момент времени . Гипотезы, верхняя текущая оценка которых меньше нижней текущей оценки, являются неправдоподобными. На каждом шаге все неправдоподобные гипотезы могут исключаться из дальнейшего рассмотрения. Анализ ситуации может быть прекращен, если на каком-либо шаге все гипотезы, кроме некоторых, станут неправдоподобными.

Две гипотезы равноправны, если |P*(Si)–P*(Sj)|  , где  – коэффициент достоверности. Пусть для некоторой гипотезы   и для всех остальных гипотез , тогда все гипотезы правдоподобны.  может быть выбрано отдельно для любой гипотезы и в целом для системы. Это значит, что для любой гипотезы могут быть дополнительно заданы , : и при этом гипотеза считается неправдоподобной, если p*(Si) > или если p*(Si)  .

Ценой свидетельства называется следующая величина:

z(qj) = ki=1 |p(Si/qj) – p(Si/qj)|.

Логично, что в первую очередь рассматриваются вопросы/признаки, имеющие наибольшую цену. Кроме порядка, налагаемого ценой свидетельства, используется порядок, объясняющий пользователю результат работы системы.
^

Общий сценарий работы системы:


while пока не выбрана гипотеза

begin

1. вычисляем цены свидетельств z(qj), j=1,n

2. проверяем свидетельство с max ценой

3. вычисляем p(Si/qj)  гипотезы, i=1,k

4. отбрасываем неправдоподобные гипотезы

end
1   2   3   4   5   6   7   8   9   10



Скачать файл (1259 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации