КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Банки терминологических данныхСреди электронных справочников особо выделяются терминологические банки данных (ТБД). Это новейшее направление терминологической деятельности, которое появилось в связи с работами по формированию терминологических картотек и быстрым ростом количества научных, технических, экономических и других терминов и невозможностью вручную обрабатывать огромные объемы терминологической информации. ТБД – это электронная оболочка данных, разбитых на узко специализированные области и ориентированных на определенные группы пользователей с различными интересами, знаниями и уровнем подготовки. Они дают возможность записывать терминологические данные всех предметных областей в электронной форме и постоянно обновлять их.
ТБД объединяют лучшие качества электронных словарей, предоставляющих дефиницию и грамматические пометы, и печатных справочников, снабжающих термины контекстом, синонимами и указанием на область употребления, используя терминологический подход к обработке данных на различных языках.
Терминологические банки данных зародились в России в 60-х гг. XX в. с идеи создания машинного фонда русского языка. Именно потребность в сборе, хранении и выдаче научной терминологии привела к созданию в нашей стране и, позднее, за рубежом многочисленных ТБД – автоматизированных собраний терминов. Каждый термин в ТБД снабжен дополнительной информацией. Даются значение термина, эквиваленты термина на других языках, допустимые и недопустимые синонимы; сообщается, каким документом утвержден термин (например, национальным или международным стандартом) и другая дополнительная информация. В зависимости от цели создания ТБД подразделяются на: - банки справочного типа (dictionary type banks), ориентированные на обеспечение работ по переводу научно-технической литературы и документации; - банки лексического типа (vocabulary type banks), предназначенные для обеспечения информацией о стандартизированной и рекомендованной терминологии.
В существующих ТБД, ориентированных на переводчиков, содержится информация, характерная для отдельного понятия без указания родственных отношений с другими единицами. Их причисляют к банкам справочного типа. Связь отдельных понятий указана лишь в форме принадлежности к одному классу, который характеризуется предметным кодом. Это позволяет вывести список терминов согласно документально-ориентированной классификации. Такой подход является достаточно удобным для определенной группы пользователей и структурирует лексику таким образом, чтобы каждая единица была более или менее изолирована, снабжена перекрестными ссылками и выдавала информацию на указанные ключевые слова.
Для научных исследований важна, прежде всего, понятийная структура предметной области и ее подразделений, отражающая взаимоотношение концептов и детальное указание на входные единицы ТБД, включая источники получения терминов. Банки лексического типа соотносятся с терминологической лексикой, где данные структурированы с отображением понятийной системы и взаимоотношений между концептами.
Значительная роль в содержании ТБД отводится непосредственно компьютерной программе и данным, заложенным в его основу. Ряд общих функций может выполняться любым банком данных, в то время как выполнение специальных функций зависит от концепции составителей банка, его целей и технических возможностей.
В настоящее время в мире насчитывается несколько десятков крупных ТБД, в том числе и в России (банк стандартизованных терминов, банк медицинских терминов и некоторые другие). Одним из самых больших в мире является ТБД германской фирмы «Siemens», содержащий порядка 2,5 миллиона терминологических единиц, представленных на восьми языках, в том числе на русском. Созданы ТБД во французской организации по стандартизации, два банка в Канаде. В Германии ТБД функционируют в Институте стандартизации и в других органах управления. В Люксембурге в терминологическом бюро Комиссии Европейского союза создан крупнейший международный ТБД в виде автоматизированного терминологического словаря на нескольких языках. Он носит название Eurodicautom. Следует также упомянуть такие авторитетные ТБД, как «Nokia Termbank» (банк данных, содержащий терминологию из области телекоммуникаций и продукции фирмы); «Nordic Termbank – Nordterm» (совместный проект скандинавских ученых); «MultiTerm» (банк данных, разработанный немецкой компанией Trades).
Рассмотрим структуру и стратегию информационного поиска на примере одного из самых авторитетных европейских ТБД – TermPlus.
Выбор данной ТБД не случаен. Система берет свое начало из всемирно известной базы данных DANTERM (the Danish Centre of Terminology), начавшей формироваться в 1978 на базе Школы Экономики в Копенгагене. TermPlus представляет собой обновленные и дополненные входные данные DANTERM, ориентированные на специализированные группы пользователей.
Банк данных TermPlus основан на логико-понятийной схеме и сконструирован так, что позволяет не только добавлять в систему новые термины, но и импортировать информацию целых предметных областей на различных языках, еще не отображенных в базе данных. Источниками ТБД являются работы известных исследователей, монографии, учебные пособия, специальные словари и банки данных. Поскольку главной целью TermPlus является охват широкого спектра подъязыков, он сочетает в себе понятия таких наук, как экономика, медицина, машиностроение, информационные технологии, химия, биология и т. д., представленные на основных европейских языках, что делает их доступными широкому кругу пользователей во всем мире. Дефиниция термина в TermPlus проверена экспертами, а сами словарные статьи даются в лаконичной форме, любой пользователь при желании может получить и более подробную информацию о термине, обратившись к дополнительным ссылкам. Являясь многоязычными системами, ТБД дают возможность выбрать необходимый язык основу и язык перевода, которые сохраняются на протяжении всей работы с данными. Эта особенность ТБД сближает их с многоязычными словарями, однако, в отличие от них, банки данных позволяют изменить заданные опции в любой момент работы. Так, TermPlus имеет в своем распоряжении семь языков (английский, немецкий, французский, датский, испанский, итальянский и русский). Добавление русского языка выгодно отличает TermPlus от многих ТБД и увеличивает круг его пользователей.
В конце словарной статьи располагается информация о предметной принадлежности термина, его последнем редактировании и о создателе словарной статьи. На первый взгляд, база данных представляет собой обычную словарную статью, характерную для стандартного толкового справочника, однако ТБД одновременно обладает рядом перекрестных ссылок, предоставляющих детальное описание понятия, необходимое опытной и профессиональной группе пользователей (терминологам, переводчикам, преподавателям, ученым, лингвистам и т. п.).
Удобная организация материала позволяет вывести на экран частичные данные: как единичный термин, так и систему концептов, исключая информацию, не соответствующую запросам пользователя. Возможен вариант выдачи списка терминов, содержащихся в той или иной области знаний. Для этого необходимо ввести определенный значок (*) в поисковое поле (search) и выбрать интересующую пользователя категорию.
Список концептов и эквивалент на языке перевода структурирован в алфавитном порядке и разбит на страницы. Количество входных единиц (по желанию работающего с ТБД исследователя) варьируется от одного до ста.
Такая стратегия информационного поиска экономит время при получении справки и повышает ценность информации. Если не ограничивать рамки поиска, он осуществляется во всех информационных категориях, имеющих отношение к искомому термину.
Поскольку искомый термин может относиться к различным областям и просмотр появившейся информации (дефиниции, контекста и т. д.) занимает определенное время, рекомендуется сузить рамки поиска, ограничившись необходимой категорией. С другой стороны, при постановке иной задачи возможно расширить рамки поиска. Допустим, необходимо узнать, как термин co-marketing (cooperative marketing) переводится на русский язык. Задав имя в командной строке, пользователь получает результат: «co-marketing» на русский язык будет переведен как «маркетинг взаимодействия».
Начинающих пользователей такая информация вполне может удовлетворить, им будет достаточно получить перевод термина на искомый язык. Однако профессиональным переводчикам требуются более подробные сведения, например, иллюстрация употребления – контекст:
Словарная статья минимизирована, но содержит ряд перекрестных ссылок (grammar, word class, validity, source, area, comment, homographs, context, scoping etc.), через которые можно получить доступ к дефиниции термина, контекстуальному значению, грамматическому материалу, синонимическому ряду и другим информационным категориям.
Для получения более детальной информации необходимо нажать клавишу «Term Information». Система выдаст окно, где путем нажатия клавиш «Term», «Definition», «Alternative terms», «Status Info» и «Concept Info» можно получить соответствующие каждой ссылке сведения.
Запись в TermPlus базируется исключительно на понятии и вся предоставляемая информация понятийно систематизирована.
Приведем пример из области микроэкономики:
Дефиниции всегда присутствуют в статье каждого термина. ТБД предлагает ссылки на источники информации, что свидетельствует о достоверности и ценности данных, содержащихся в системе.
Каждой предметной области присвоен код. Группы, объединенные тематически, обладают отдельным порядковым номером, состоящим из цифрового ряда. Причем первое число соответствует области знания, второе – тематической группе, третье – более узкой подгруппе и т. д. Например, в области Microeconomics, которой присвоен порядковый номер 1, понятие «Scarce Resources and Choice» обладает номером 1 '2, «Unlimited Wants» имеет маркировку 1’2’1, «Scarcity» – 1’2’2, «Choice» – 1’2’3, «Utility-Maximization» – 1’2’4, «Resources» – 1’2’5, «Goods and Services» – 1’2’6, а такие понятия как «Free Goods» и «Scarce Resources» расположены под номерами 1’2’5.1 и 1’2’5.2 и «Luxury и Necessity» под 1’2’6.1 и 1’2’6.2 и т. д., формируя концептуальную систему.
Такая понятийная организация материала позволяет использовать ТБД в совокупности с переводными системами (Translational Memory Systems) и самостоятельно конструировать подобные системы для других предметных областей.
|