КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Системы распределенной обработки данных
Потребность в данных коллективного пользования в последнее время все более возрастает. Это послужило причиной все усиливающегося внимания к различным системам распределенной обработки данных. Существует несколько понятий в этой области, которые необходимо определить более точно. Вначале выделим эти понятия: распределенная обработка данных; базы данных с сетевым доступом; архитектура «клиент-сервер»; распределенные базы данных. Под распределенной обработкой данных понимают обработку приложений несколькими территориально распределенными машинами. При этом в приложениях, связанных с обработкой базы данных, собственно управление базой данных может выполняться централизованно. Системы баз данных, построенные с помощью сетевых версий, иногда неправомерно называют распределенными базами данных, в то время как фактически имеют дело лишь с распределенным (сетевым) доступом к централизованной базе данных. Такие системы создаются на основе оборудования и программного обеспечения различных локальных вычислительных сетей; большинство СУБД работает в сетях IBM PC Network (IBM Corp.), Novell Network (Novell Inc.). Архитектура систем баз данных с сетевым доступом предполагает выделение одной из машин сети в качестве центральной. Эта машина обеспечивает функционирование той части сетевой версии СУБД, которая осуществляет управление данными в терминах базы данных и называется сервером файлов (File Server). Предполагается, что центральная машина обладает жестким диском достаточно большой емкости, на котором хранится совместно используемая централизованная база данных. Все другие машины сети выполняют функции рабочих станций (Workstation), с помощью которых поддерживается доступ пользователей системы к централизованной базе данных. В соответствии с пользовательскими запросами файлы базы данных передаются на рабочие станции, где в основном и производится их обработка. Рабочая станция должна иметь достаточно ресурсов для обеспечения приемлемого уровня реактивности при обработке пользовательских запросов. Поскольку СУБД с сетевым доступом построены из расчета, что вся обработка данных ведется на рабочей станции, то рассматриваемый вариант архитектуры системы баз данных характеризуется большим сетевым трафиком, что отрицательно сказывается на производительности и надежности системы. Сетевые версии отличаются от локальных версий тем, что они рассчитаны на мультипользовательскую обстановку. Это предполагает обладание некоторыми специальными механизмами, позволяющими многим пользователям совместно обращаться к общим ресурсам данных из централизованной базы данных. К числу таких механизмов относятся механизмы синхронизации транзакций, основанные на технике блокирования ресурсов и позволяющие производить обновление данных при параллельной работе различных пользователей, а также механизмы управления доступом, обеспечивающие конкретным пользователям операции над базой данных'в рамках тех полномочий, которые им предоставлены. В сетевых версиях СУБД используются разнообразные протоколы блокирования ресурсов. Некоторые системы обеспечивают в определенных ситуациях автоматическое блокирование ресурсов, освобождая разработчика от необходимости заботиться об этом. В других системах имеются только средства явного блокирования. Протокол, принятый, например, в СУБД R:BASE for DOS, допускает возможность блокирования ресурсов данных вплоть до уровня поля. Благодаря этому два пользователя могут одновременно обновлять одну и ту же строку таблицы, но разные ее поля. Выбор разработчиками такой мелкой единицы блокирования позволяет минимизировать интегральное время ожидания доступа к блокированному ресурсу при исполнении приложения. Представляют интерес «тонкие» средства блокирования ресурсов, при котором один пользователь блокирует строку для обновления, а другой — может тем не менее в это же время читать ее. СУБД позволяет пользователям иметь информацию о том, кто в данный момент блокирует запрашиваемые ими данные. Сложные проблемы связаны в мультипользовательском режиме работы с базами данных с тупиковыми ситуациями (Deadlock). В технологии баз данных предусматривается специальная техника профилактики возникновения тупиковых ситуаций и отката (Roll-Back) транзакций при их возникновении. В некоторых СУБД обеспечивается возможность для приложений направлять специальные сообщения о намерениях, связанных с блокированием ресурсов, в поддерживаемый для этих целей системой «почтовый ящик», а также получать информацию из такого «почтового ящика», об установленных в данный момент блокировках. Подобная информация позволяет каждому пользователю соблюдать «джентльменскую линию поведения» для того, чтобы исключить возможность возникновения тупиковых ситуаций. В последнее время происходит существенная трансформация подходов к использованию баз данных в обстановке локальных сетей, направленная на повышение роли центральной машины сети, ранее используемой лишь для реализации сервера файлов. Это означает, что сервер файлов центральной машины обеспечивает обработку параллельных запросов на файлы, поступающие с рабочих станций, используя необходимую дисциплину блокирования ресурсов; рабочие станции должны при этом копировать с центральной машины нужные им файлы базы данных и выполнять их обработку.
19.6.1. Архитектура «клиент-сервер»
Новая модель взаимодействия компьютеров в сети получила название «клиент-сервер». Каждый из составляющих эту архитектуру элементов играет свою роль: сервер владеет и распоряжается информационными ресурсами системы, клиент - имеет возможность воспользоваться ими. Сервер базы данных представляет собой мультипользователь-скую версию СУБД, параллельно обрабатывающую запросы, поступившие со всех рабочих станций. В его задачу входит реализация логики обработки транзакций с применением необходимой техники синхронизации - с поддержкой протоколов блокирования ресурсов, с обеспечением предотвращения и (или) устранения тупиковых ситуаций. В ответ на пользовательский запрос рабочая станция получит не «сырье» для последующей обработки, а готовые результаты. Программное обеспечение рабочей станции при такой архитектуре играет роль только внешнего интерфейса (Front—end) централизованной системы управления данными. Это позволяет существенно уменьшить сетевой трафик, сократить время на ожидание блокированных ресурсов данных в мультипользовательском режиме, разгрузить рабочие станции и при достаточно мощной центральной машине использовать для них более дешевое оборудование. Как правило, клиент и сервер территориально отделены друг от друга, и в этом случае они входят в состав или образуют систему распределенной обработки данных. Для современных СУБД архитектура «клиент-сервер» стала фактически стандартом. Если предполагается, что проектируемая информация будет иметь архитектуру «клиент-сервер», прикладные программы, реализованные в ее рамках, будут иметь распределенный характер. Это означает, что часть функций приложений будет реализована в программе-клиенте, другая — в программе-сервере. Основной принцип технологии «клиент-сервер» заключается в разделении функций стандартного интерактивного приложения на четыре группы: функции ввода и отображения данных; прикладные функции, характерные для предметной области; фундаментальные функции хранения и управления ресурсами (базами данных); служебные функции. Исходя из этого деления любое приложение может состоять из следующих компонентов: компонент представления (функции первой группы); прикладной компонент (функции второй группы); компонент доступа к информационным ресурсам (функции третьей группы и протокол их взаимодействия). Различия определяются четырьмя факторами: какие виды программного обеспечения в логических компонентах; какие механизмы программного обеспечения используются для реализации функций трех групп; как логические компоненты распределяются компьютерами в сети; какие механизмы используются для связи компонент между собой. Исходя из этих допущений рассмотрим четыре подхода, реализованные в моделях технологии «клиент-сервер». 1. FS-моделъ — базовая для локальных сетей персональных компьютеров. Применялась для разработки информационных систем на базе FoxPRO, Clipper, Paradox. Основные требования: выделяется файл-сервер для реализации услуг по обработке файлов других узлов сети; работает под управлением сетевых ОС; играет роль компонент доступа к информационным ресурсам; в остальных узлах функционирует приложение, в кодах которого совмещены компонент представления и прикладной компонент; протокол обмена — набор низкоуровневых вызовов; Технология: запрос направляется на файловый сервер, который передает СУБД, размещенной на компьютере-клиенте, требуемый блок данных. Вся обработка осуществляется на компьютере-клиенте. Недостатки: высокий сетевой трафик; небольшое число операций манипулирования; недостаточные требования к безопасности. 2. RDA-модель. Основные требования: коды компонента представления и прикладного компонента совмещены и выполняются на компьютере-клиенте; доступ к информационным ресурсам обеспечивается операторами непроцедурного языка SQL. Технология: клиентский запрос направляется на сервер, где функционирующее ядро СУБД обрабатывает запрос и возвращает результат (блок данных) клиенту. Ядро СУБД выполняет пассивную роль; инициатор манипуляций с данными — программы на компьютере-клиенте. Достоинства: процессор сервера загружается операциями обработки данных; уменьшается загрузка сети, так как передаются по сети запросы на языке SQL; унификация интерфейса «клиент-сервер» в виде языка SQL; использование его в качестве стандарта общения клиента и сервера. Недостатки: удовлетворительное администрирование приложений в RDA-модели невозможно из-за совмещения в одной программе различных по своей природе функций (представления и прикладные). 3. DBS-модель, — реализована в реляционных СУБД Informix, Ingres, Oracle. Основные требования: основа модель-механизм хранимых процедур — средство программирования SQL-сервера; процедуры хранятся в словаре базы данных; разделяются между несколькими клиентами и выполняются на компьютере, где функционирует SQL-сервер; компонент представления выполняется на компьютере-клиенте, прикладной компонент и ядро СУБД — на компьютере-сервере базы данных. Достоинства: возможность централизованного администрирования; вместо SQL-запросов по сети передаются вызовы хранимых процедур, что ведет к снижению сетевого трафика. Недостатки: в большинстве СУБД недостаточно возможностей для отладки и типизирования хранимых процедур; ограниченность средств для написания хранимых процедур. На практике чаще используется разумный синтез RDA- и DBS-моделей для построения многопользовательских информационных систем. 4. AS-модель. Основные требования: на компьютере-клиенте выполняется процесс, отвечающий за интерфейс с пользователем; этот процесс, обращаясь за выполнением услуг к прикладному компоненту, играет роль клиента приложения (АС); прикладной компонент реализован как группа процессов, выполняющих прикладные функции, и называется сервером приложения (AS); все операции над БД выполняются соответствующим компонентом, для которого AS — клиент. RDA- и DBS-модели имеют в основе двухзвенную схему разделения функций. В RDA-модели прикладные функции отданы клиенту, в DBS-модели их реализация осуществляется через ядро СУБД. В RDA-модели прикладной компонент сливается с компонентом представления, в DBS-модели — интегрируется в компонент доступа к ресурсам. В AS-модели реализована трехзвенная схема разделения функций, где прикладной компонент выделен как важнейший изолированный элемент приложения, имеющий стандартизированные интерфейсы с двумя другими компонентами. AS-модель является фундаментом для мониторов обработки транзакций.
|