Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Лингвистический аспект




Лингвистический аспект касается исследований языковых проблем, так как язык — это основное средство общения в процессе извлечения знаний.

В инженерии знаний можно выделить три слоя лингвистических проблем (рис.):

r «общий код»;

r понятийная структура;

r словарь пользователя.

Рис. 20.Лингвистический аспект извлечения знаний

«Общий код»

«Общий код» решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты:

r общенаучная терминология;

r специальные понятия из профессиональной литературы;

r элементы бытового языка;

r неологизмы, сформированные, за время совместной работы;

r профессиональный жаргон и др.

Детализация схемы общения (см. рис. 24) позволяет представить средства общения как два потока, в которых нас интересуют компоненты и — языки, на которых говорят аналитик и эксперт ( , — невербальные компоненты). Различие языков и обусловливает «языковый барьер» или «языковые ножницы» в общении инженера по знаниям и эксперта.

Эти два языка являются отражением «внутренней речи» эксперта и аналитика, поскольку большинство психологов и лингвистов считают, что язык — это основное средство мышления наряду с другими знаковыми системами «внутреннего пользования» (универсальный семантический код — УСК, языки «смысла», концептуальные языки и др.).

Язык аналитика состоит из трех компонентов:

r общенаучной терминологии из его «теоретического багажа»;

r терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;

r бытового разговорного языка, которым пользуется аналитик.

Язык эксперта включает:

r общенаучную терминологию;

r специальную терминологию, принятую в предметной области;

r бытовой язык;

r неологизмы, созданные экспертом за время работы, то есть его профессиональный жаргон.

Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают (хотя реально объем второго компонента у эксперта существенно больше), то некоторый общий язык или код, который необходимо выработать партнерам для успешного взаимодействия, будет складываться из потоков, представленных на рис. 3.

В дальнейшем этот общий код преобразуется в некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование терминов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу, то есть по понятийной близости (это уже первый шаг структурирования знаний).

 

Рис. 21.Структура общего кода

На этом этапе аналитик должен с большим вниманием отнестись ко всем специальным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной области — первый рубеж на подступах к созданию адекватной базы знаний.

Рисунок 4 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает «знак» и «означаемый предмет». Только в интерпретации знак получает смысл. Так, на рис. 29 слова «прибор X» для эксперта означает некоторую конкретную схему, которая соответствует схеме оригинала прибора, а в голове начинающего аналитика слова «прибор X» вызывают пустой образ или некоторый черный ящик с ручками.

Рис. 22.Неоднозначность интерпретации

Внимание к лингвистическому аспекту проблемы извлечения знаний способствует сближению образа 1 с образом 2 и интерпретации с интерпретацией , а слова «прибор X» перейдут в действительно «общий» код.


Поделиться:

Дата добавления: 2015-04-18; просмотров: 286; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты