1. Введение в базы данных
В 60-х годах была осознана необходимость применения средств компьютерной обработки хранимой информации. Это произошло в первую очередь там, где были накоплены значительные объемы полезных данных: в военной промышленности и бизнесе. Появились автоматизированные информационные системы АИС, программно-аппаратные комплексы, предназначенные для хранения, обработки информации и обеспечения ее пользователя. Первые АИС работали в основном с информацией фактического характера, такой, как характеристики объектов и их связей. По мере интеллектуализации ЭВМ, появилась возможность обрабатывать текстовые документы на естественном языке, изображения и другие виды и форматы представления данных.
Несмотря на то, что принципы хранения данных в системах обработки фактической и документальной (текстовой) информации схожи, алгоритмы обработки в них заметно различаются. Поэтому в зависимости от характера информационных ресурсов, которыми оперируют такие системы, принято различать два их класса: документальный и фактографический.
Документальные системы служат для работы с документами на естественном языке: монографиями, периодическими публикациями, текстами законодательных актов.
Наиболее распространенный тип документальных систем – информационно-поисковые системы, предназначенные для накопления и поиска по различным критериям документов на естественном языке.
Другой большой класс автоматизированных систем – фактографические системы. Они оперируют фактическими сведениями, представленными в виде, специальным образом организованной совокупности формализованных записей данных. Центральное функциональное звено фактографических информационных систем – системы управления базами данных СУБД. Фактографические системы используются не только для реализации справочных функций, но и для решения задач обработки данных, т.е. имеются в виду задачи, связанные с вводом, хранением, сортировкой и группировкой записей данных однородной структуры. В большинстве случаев эти задачи предусматривают предоставления пользователям итоговых результатов обработки в виде отчетов в табличной форме.
Задачи, связанные с обработкой данных, решаются с использованием АИС и широко распространены во всех сферах деятельности, начиная с производства, управления финансами и телекоммуникациями, и заканчивая управлением семейным бюджетом.
Массивы информации, накопленные в АИС, должны быть оптимальным образом организованы для их компьютерного хранения и обработки, должна быть обеспечена их целостность и непротиворечивость. Используя функции стандартных файловых систем невозможно добиться нужной производительности при решении подобных задач, поэтому все АИС опираются на СУБД.
СУБД обеспечивает создание СУБД, поддержание ее в актуальном состоянии и обеспечения эффективного доступа пользователей и их приложений к содержащейся в ней информации.
2. Модели данных
Любая АИС оперирует с моделью той или иной части реального мира предметной областью. Предметная область рассматривается как некоторая совокупность реальных объектов и связи между ними, причем каждый объект обладает определенным набором свойств/атрибутов. Способ отражения сущностей атрибутов и связей на структуры данных определяются моделью данных. Принято выделять иерархическую, сетевую, реляционную и объектно-ориентированную модели данных. Соответственно, говорят об иерархических, сетевых, реляционных и объектно-ориентированных СУБД.
Иерархическая модель позволяет строить БД с иерархической древовидной структурой. Эта структура определяется как дерево, образованное попарными связями. На самом верхнем узле дерева имеется узел, называемый корнем; все другие узлы, кроме корня, связываются только с одним узлом на более высоком по отношению к ним уровне.
Пример иерархической древовидной структуры
Основное достоинство иерархической модели: простота описания иерархических структур реального мира.
Если в модели каждый порожденный элемент может иметь более одного исходного, то такая модель называется сетевой, В ней элемент м/б связан с любым др. без ограничений.
Сетевая БД может состоять из набора записей, соответствующих каждому экземпляру объекта предметной области и набора связей м/д ними.
В данном примере сетевая модель хорошо отражает то, что в проекте могут участвовать разные сотрудники и в то же время сотрудник может участвовать в различных проектах.
В реляционных БД вся информация представляется в виде прямоугольных таблиц. Реляционная модель опирается на систему понятий реляционной алгебры, важнейшие из которых: таблица, отношение, строка, столбец, первичный ключ. Все операции над реляционными БД сводится к манипуляциям над таблицами.
Модели ОО-СУБД берут свое начало от ОО ЯП. Основная идея, объединяющая эти две области, состоит в том, что пользователям приходиться оперировать не понятиями, связанными с аппаратным обеспечением (биты, байты, записи, поля), а понятиями, которые более всего отвечают структуре реального мира, а именно объектами и операциями, определенными для этих объектов. Это позволяет, в отличии от других БД, говорить о возможности сохранения семантики предметной области в ОО БД благодаря повышению уровня абстракции.
БД, шпора 1
08 Янв, 2009