КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
ПРИЛОЖЕНИЕ. Система STARLING реализована на одном из диалектов языка xBase, и на этом языке можно осуществлять разнообразные запросы к базам данныхСистема STARLING реализована на одном из диалектов языка xBase, и на этом языке можно осуществлять разнообразные запросы к базам данных. Отдельные базы данных можно связывать друг с другом, формируя так называемую реляционную СУБД. Сами базы данных имеют широко распространенный формат DBF (database files), но дополнены специальным типом полей переменной длины для хранения и обработки больших текстовых и лексикографических массивов. Приведем описание типичной этимологической базы данных, содержащей сравнительный словарь северно-кавказских языков (аналогичные базы имеются уже для целого ряда языковых семей). На нижнем иерархическом уровне здесь находятся файлы, содержащие списки базисной лексики отдельных подгрупп северно-кавказских языков: 1) AAND.DBF — аваро-андийские языки (аварский, андийский, ахвахский, ботлихский, багвалинский, годоберинский, каратинский, чамалинский, тиндинский). 2) ABAD.DBF — абхазо-адыгские языки (абхазский, абазинский, адыгейский, кабардинский, убыхский). 2) CEZ.DBF — цезские языки (цезский, гинухский, хваршинский, инхокваринский, гунзибский, бежтинский). 3) DARG.DBF — даргинский язык (с диалектами). 4) KHIN.DBF — хиналугский язык. 5) LAK.DBF — лакский язык (с диалектами). 6) LEZG.DBF — лезгинские языки (лезгинский, агульский, табасаранский, рутульский, цахурский, крызский, будухский, арчинский, удинский). 7) NAKH.DBF — нахские языки (чеченский, ингушский, бацбийский). Эти файлы в принципе содержат небольшой объем лексики (стандартный стословный список наиболее устойчивой лексики), и являются факультативным звеном общей словарной системы. Они служат прежде всего лексикостатистическим задачам, и полный этимологический словарь можно начинать строить и со следующего уровня. Следует, однако, заметить, что обычно оказывается удобным начинать построение базы данных именно с заполнения такого рода списков. При правильном построении базы каждое слово из списка связано с соответствующей этимологической информацией из файла более высокого иерархического уровня. На следующем иерархическом уровне находятся этимологические файлы для подгрупп (соответственно: AANDET.DBF, ABADET.DBF, CEZET.DBF, DARGET.DBF, KHINET.DBF, LAKET.DBF, LEZGET.DBF и NAKHET.DBF). Каждый из этих файлов, по сути дела, представляет собой самостоятельный этимологический словарь соответствующей подгруппы, и может пополняться независимо от всех остальных. При этом для любого корня, если он имеет северно-кавказское происхождение, можно получить информацию из более высокого в иерархии файла. На самом высоком иерархическом уровне находится файл CAUCET.DBF, через который связаны между собой все файлы более низкого уровня. Находясь в этом файле мы можем наблюдать все отражения какого-либо общесеверно-кавказского корня в языках-потомках. Схематически структура связей выглядит следующим образом:
Рисунок CAUCET.DBF
AANDET ABADET CEZET DARGET KHINET LAKET LEZGET NAKHET
AAND ABAD CEZ DARG KHIN LAK LEZG NAKH
При таком устройстве легко оперировать как со всей базой данных, так и с отдельными ее фрагментами. В системе STARLING предусмотрена возможность связывания между собой при помощи реляционных отношений произвольного числа файлов баз данных. Программа STARLING существует в настоящее время в трех версиях: 1) Версия для DOS — пока наиболее полная и содержащая весь комплекс компаративистских программ; 2) Версия для Windows, изготовленная недавно и еще не включающая в себя сравнительно-исторического компонента; 3) Сервер баз данных, обеспечивающий функционирование этимологических баз данных в Интернете.
|