КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Словарь пользователяЧасто профессиональный уровень конечного пользователя не позволяет ему применить специальный язык предметной области в полном объеме. Неожиданными для начинающих разработчиков являются проблемы формирования отдельного словаря для создания дружественного интерфейса с пользователем ЭС. Необходимы специальные приемы, увеличивающие «прозрачность» и доступность системы. Для разработки пользовательского интерфейса требуется дополнительная доработка словаря общего кода с поправкой на доступность и «прозрачность» системы. Так, при разработке экспертной системы по психодиагностике АВТАНТЕСТ пришлось разработать два словаря терминов — один для психологов-профессионалов, второй — для неспециалистов (испытуемых). Поскольку результат психодиагностического тестирования всегда интересен испытуемому, ему выдается листинг с психологическим заключением на общелитературном языке без употребления специальных терминов. Интересно, что при внедрении системы использовался в основном этот второй словарь; даже профессиональные психологи предпочитали получать тексты на обыденном языке.
Гносеология — это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека. Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании БЗ эксперт часто впервые формулирует некоторые закономерности, до того момента составлявшие его личный опыт. Инженерия знаний как наука, если можно так выразиться, дважды гносеологична — сначала действительность (О) отражается в сознании эксперта ( ) а затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям ( ), что служит уже основой для построения третьей интерпретации ( ) — поля знаний экспертной системы (см. рис. 31). Процесс познания, в сущности, направлен на создание внутренней репрезентации окружающего мира в сознании человека. Рис. 24.Процесс познания Познание часто сопровождается созданием новых понятий и теорий. Иногда эксперт порождает новые знания прямо в ходе беседы с аналитиком. Нужно стремиться увидеть общее, то есть строить цепочки. факт " обобщенный факт " эмпирический закон " теоретический закон. Не всегда удается дойти до последнего звена этой цепочки, но уже само стремление к движению бывает чрезвычайно плодотворным. Такой подход полностью согласуется со структурой самого знания, которое имеет два уровня: r эмпирический (наблюдения, явления). r теоретический (законы, абстракции, обобщения).
Разделение стадий извлечения и структурирования знаний является весьма условным, поскольку хороший инженер по знаниям, уже извлекая знания, начинает работу по структурированию и формированию поля знаний. Методология структурирования близка к современной теории больших систем или сложных систем, где традиционно акцент делается на процессе проектирования. В целом существующие подходы к проектированию сложных систем можно разделить на два больших класса: r структурный (системный) подход или анализ, основанный на идее алгоритмической декомпозиции, где каждый модуль системы выполняет один из важнейших этапов общего процесса; r объектный подход, связанный с декомпозицией и выделением не процессов, а объектов, при этом каждый объект рассматривается как экземпляр определенного класса. В структурном анализе разработано большое число выразительных средств для проектирования, в том числе графических: r диаграммы потоков данных (DFD, data-flow diagrams), структурированные словари (тезаурусы), языки спецификации систем, таблицы решений; r стрелочные диаграммы "объект-связь" (ERD, entity-relationship diagrams), диаграммы переходов (состояний); r деревья целей; r блок-схемы алгоритмов; r средства управления проектом (PERT-диаграммы, диаграммы Ганта и др.). Множественность средств и их некоторая избыточность объясняется тем, по каждая предметная область, используя структурный подход как универсальное средство моделирования, вводила свою терминологию, наиболее подходящую для отражения специфики конкретной проблемы. Поскольку инженерия знаний имеет дело с широким классом ПО (это "мягкие" ПО), встает задача разработки достаточно универсального языка структурирования. Объектный (объектно-ориентированный) подход (ООП) был разработан в 1979 как технология программирования больших программных продуктов и базируется на основных элементарных понятиях: r объекты и классы как объекты, связанные общностью структуры и свойств; r классификации как средства упорядочения знаний; r иерархии с наследованием свойств; r инкапсуляции как средства ограничения доступа; r методы и полиморфизм для определения функций и отношений. ООП имеет систему условных обозначений и предлагает набор моделей для проектирования сложных систем. Широкое распространение объектно-ориентированных языков программирования C++, CLOS, Smalltalk и др. успешно демонстрируют жизнеспособность и перспективность этого подхода. В последнее время этот подход успешно применяется и в CASE-средствах не только для проектирования программ, но и для моделирования бизнес-процессов. Особенную популярность приобретает язык UML (Unified Modelling Language), и программный инструментарий на нем основанный, например Rational Rose. Объектно-структурный подход (ОСП) В качестве базисной парадигмы структурного анализа знаний и формирования поля знаний можно предложить обобщенный объектно-структурный подход (ОСП). На основе ОСП предлагается алгоритм объектно-структурного анализа (ОСА) предметной области, позволяющего оптимизировать и упорядочить достаточно размытые процедуры структурирования знаний. ОСА подразумевает дезагрегацию ПО, как правило, на восемь страт или слоев. Практические методы структурирования В качестве простейшего прагматического подхода к формированию поля знаний начинающему инженеру по знаниям можно предложить следующий алгоритм: 1.Определение входных {X} и выходных {У} данных. Этот шаг совершенно необходим, т. к. он определяет направление движения в поле знаний — от X к Y. Кроме того, структура входных и выходных данных существенно влияет на форму и содержание поля знаний. На этом шаге определение может быть достаточно размытым, в дальнейшем оно будет уточняться. 2.Составление словаря терминов и наборов ключевых слов N. На этом шаге проводится текстуальный анализ всех протоколов сеансов извлечения знаний и выписываются все значимые слова, обозначающие понятия, явления, процессы, предметы, действия, признаки и т. п. При этом следует попытаться разобраться в значении терминов. Важен осмысленный словарь. 3.Выявление объектов и понятий {А}. Производится "просеивание" словаря N и выбор значимых для принятия решения понятий и их признаков. В идеале на этом шаге образуется полный систематический набор терминов из какой-либо области знаний. 4.Выявление связей между понятиями. Все в мире связано. Но определить как направлены связи, что ближе, а что дальше, необходимо на этом этапе. Таким образом, строится как сеть ассоциаций, где связи только намечены, но пока не поименованы. Например, понятия "день", "ночь", "утро" и "вечер" явно как-то связаны, связаны также и понятия "красный флаг" и "красный галстук", но характер связи тут существенно отличен. Рис. 25.Стадии структурирования знаний — алгоритм для "чайников" 5.Выявление метапонятий и детализация понятий. Связи, полученные на предыдущем шаге, позволяют инженеру по знаниям структурировать понятия и как выявлять понятия более высокого уровня обобщения (метапонятия), так и детализировать на более низком уровне. 6.Построение пирамиды знаний. Под пирамидой знаний мы понимаем иерархическую лестницу понятий, подъем по которой означает углубление понимания и повышения уровня абстракции (обобщенности) понятий. Количество уровней в пирамиде зависит от особенностей предметной области, профессионализма экспертов и инженеров по знаниям. 7.Определение отношений {RA}. Отношения между понятиями выявляются как внутри каждого из уровней пирамиды, так и между уровнями. Фактически на этом шаге даются имена тем связям, которые обнаруживаются на шагах 4 и 5, а также обозначаются причинно-следственные, лингвистические, временные и другие виды отношений. 8.Определение стратегии принятия решения (Sf). Определение стратегии принятия решения, т. е. выявление цепочек рассуждений, связывает все сформированные ранее понятия и отношения в динамическую систему поля знаний. Именно стратегии придают активность знаниям, именно они "перетряхивают" модель М в поиске от X к Y. 9.Завершающее структурирование поля. Подразумевает упорядочивание полученной структуры, удаление дублирующих или лишних деталей, корректировку и уточнение всех конструкций. Однако на практике при использовании данного алгоритма можно столкнуться с непредвиденными трудностями, связанными с ошибками на стадии извлечения знаний и с особенностями знаний различных предметных областей. Тогда возможно привлечение других, более "прицельных" методов структурирования. При этом на разных этапах схемы (см. рис. ) возможно использование различных методик. При этом, естественно, для таких простых и очевидных шагов, как определение входных и выходных понятий или составление словаря терминов, никаких искусственных методов предлагаться не будет.
Рассмотрим классификацию методов извлечения знаний, которая позволит инженерам по знаниям в зависимости от конкретной задачи и ситуации выбрать подходящий метод (рис. 1). Рис. 26.Классификация методов извлечения знаний При такой классификации в качестве основного принципа деления выступает источник знаний. Соответственно все методы делятся на: r коммуникативные; r текстологические. Коммуникативные методы извлечения знаний— это набор приемов и процедур, предполагающих контакт инженера по знаниям с непосредственным источником знаний — экспертом, а текстологические включают методы извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников). В свою очередь, коммуникативные методы можно также разделить на две группы: r пассивные; r активные.
|