Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Преимущества электронных словарей




При традиционном подходе минимальной единицей доступа является лексема (имя словарной статьи): нужно прочесть всю статью, чтобы определить, содержится ли в ней ответ на наш запрос. Для таких словарей, как оксфордский, это представляет серьезную проблему. Например, глагол «set» имеет там 400 только основных значений (и у многих из них имеются подзначения).

 

Пользователь хотел бы, чтобы словарь максимально локализовал релевантную информацию. При этом речь не идет об автоматическом выборе переводного эквивалента (если мы говорим о переводном словаре). Специфика словарного ответа в том, что он дает весьма разнообразную информацию о слове или словосочетании, а не просто переводное соответствие, предполагает активный выбор пользователя из нескольких возможных хорошо обоснованных альтернатив.

 

Однако попытка решить проблему адекватной реакции словаря на запрос неизбежно наталкивается на сопротивление самого словарного материала, перенесенного из бумажного словаря.

 

Электронные словари не только содержат транскрипцию, но и могут произносить слова. Здесь тоже существует два подхода. В МультиЛекс встроен синтезатор звука и произносятся все слова. Однако полностью доверять такому подходу, не контролируя его по транскрипции, опасно. Синтезатор может неправильно поставить ударение или вообще исказить произношение слова. В ABBYY Lingvo основную лексику озвучивает диктор с оксфордским произношением.

 

Основное преимущество хороших электронных словарей – одновременный поиск не только по названию словарной статьи, но и по всему огромному объему словарей, что просто нереально в бумажном варианте. Такой поиск создает многомерный портрет слова, при этом извлекаются из глубин словарной статьи не только конкретные примеры его использования и устойчивые выражения, в которых слово встречается, но и обнажаются, становятся явными языковые законы, которым подчиняются правила словообразования. В Lingvo можно также строить и свой собственный словарь под общей оболочкой.

 

Язык – отражение реальной жизни. А жизнь не стоит на месте: появляются новые отрасли производства, науки, бизнеса, культуры. В обычную разговорную речь приходят новые слова, термины, устойчивые словосочетания. Можно ли представить в речи наших сограждан лет десять назад такие слова, как «холдинг», «транш»? Выражение «конечный пользователь» вызвало бы у них недоумение, и никто не мог бы предположить, что слово «мыло» будет означать на компьютерном жаргоне электронную почту (вольная русская транскрипция английского слова «e-mail»).

 

Вся эта лексика не может быть адекватно отражена в «бумажных» словарях, т.к. они слишком долго готовятся. Так, известный англо-русский словарь Мюллера, сочетающий относительную простоту пользования – один том – и полноту содержания, был издан в 1960 году и с тех пор претерпел лишь косметические изменения в 1978 и 1994 годах.

 

Фактически многие словари, которые сформировались в языковой атмосфере середины ХХ века, сильно устарели. В них не указаны современные значения старых слов, а многие новые слова просто отсутствуют. Буквальное перенесение таких словарей на компьютеры бесперспективно. Это стало особенно очевидно в связи с развитием Интернета: большая часть Веб-страниц состоит из английских текстов, написанных живым современным языком, обильно использующим разговорную лексику и сленг. Вряд ли какой-либо из существующих англо-русских словарей может ответить на этот вызов. Решить данную задачу под силу лишь электронным словарям.

 

Большинство «бумажных» словарей ориентировано на человека, читающего на иностранном языке, то есть человека, который в непонятном ему тексте находит «опорные» слова, помогающие выстроить общую смысловую картину. Человек «пишущий», кроме знания всех используемых слов, должен четко представлять, как эти слова сочетаются друг с другом, какие предлоги при этом используются, есть ли устойчивые выражения, передающие необходимый смысл. И здесь электронный словарь оказывается намного полезнее «бумажного». Даже буквальное воспроизведение качественного «бумажного» словаря на компьютере дает возможность извлечь из него необходимую информацию. Например, пользователь может открыть на экране сразу несколько словарных статей, характеризующих все значения слова «достать» («брать», «получать», «надоесть» и т. д.) как на одном языке, так и на другом, и, таким образом, изучить все нюансы использования слова.

 

Таким образом, в современных электронных словарях отражено пионерское достижение российской лексикографии – двуязычный словарь во многом становится толковым. Кроме того, такой электронный словарь, как Lingvo, строит нажатием нужной клавиши парадигму, то есть совокупность всех форм слова.

 

Первый и очевидный шаг, на который уже идут создатели электронных словарей, это первичная разметка словарной статьи, формализация той внутренней структуры, которая в той или иной мере имеется в хороших бумажных словарях. В результате полнотекстовый поиск может различать, к примеру, переводы, примеры использования и комментарии, что принципиально усиливает его возможности с точки зрения пользователя.

 

Главная задача состоит в том, чтобы единицей описания было отдельное лексическое значение, и технологии анализа могли бы устанавливать соответствие между исходным запросом и теми лексическими значениями, которые релевантны для этого запроса по синтаксическим и семантическим критериям.

 

В качестве иллюстрирующего примера можно привести практически любой глагол, принадлежащий ядру языка. Например, глагол «развести» может встретиться в таких контекстах:

разводить руками;

разводить спирт водой;

разводить супругов;

разводить мосты;

разводить баранов;

разводить дерущихся;

разводить пилу;

разводить/разбивать сады

(английские эквиваленты: bring; conduct; part, separate; mix; dissolve; divorce; breed; plant, etc...)

 

Задача создания такого словарного содержания, которое позволило бы сделать единицей анализа отдельное лексическое значение, а не морфологическую лексему, является, вероятно, наиболее перспективным направлением в компьютерной лексикографии. Ясно, что для ее решения требуется «синхронизация» словарных описаний и формальных моделей, используемых технологиями анализа. В идеале это должно быть единое интегральное лексико-синтактико-семантическое описание.

 

Для массовых программных продуктов, каковыми являются электронные словари, характерны частая смена версий и наличие постоянной обратной связи с тысячами пользователями. Поэтому компьютерная лексикография – это неизбежно актуальная лексикография.

 

Одной из центральных проблем переводной лексикографии является проблема эквивалентности. Переводные эквиваленты выполняют семантизирующую функцию в переводном словаре. Под словарным эквивалентом подразумевается перевод, приписываемый автором словаря лексеме входного языка. Традиционно выделяется три типа эквивалентности: полная, частичная и ложная (безэквивалентность).

 

Полная эквивалентность наблюдается в том случае, когда лексемы сравниваемых языков имеют сходную внешнюю форму и полностью совпадают семантически.

Частичная эквивалентность имеет место в случае совпадения одних и несовпадения других значений семантических структур внешне сходных лексем. В таком случае совпадающие значения В.В. Дубичинский называет интерлексами – «интернациональными лексико-семантическими вариантами лексем». Несовпадающие значения, «специфические лексико-семантические варианты, отражающие национально-культурное своеобразие лексем», называются идиолексами. Таким образом, семантическая структура частичных эквивалентов включает интерлексы и идиолексы.

 

В.П. Берков добавляет две разновидности частичных эквивалентов: а) свободные частичные, используемые независимо от окружения, и б) связанные частичные, сочетаемость которых ограничена.

 


Поделиться:

Дата добавления: 2015-09-13; просмотров: 156; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты