Skip to main content

任务四 物理结构设计

一、核心定义与设计步骤

1. 定义

数据库物理结构设计是指对给定的逻辑数据模型,选取最适合应用环境的物理结构(包括存储结构与存取方法)的过程。

2. 基本步骤

物理设计分为两步:

  1. 确定数据库的物理结构:根据逻辑模型和应用需求,设计具体的存储与存取方案。
  2. 评价物理结构:重点从时间效率(响应速度)和空间效率(存储利用率)两个维度评估方案优劣,选择最优解。

二、子任务一:物理结构设计的核心内容

物理设计依赖于具体的数据库管理系统(DBMS),设计时需充分了解:

  • 所用DBMS的内部特征,特别是其提供的存取方法和存储结构。
  • 数据的特性、用途,以及应用环境的处理频率、响应时间要求。

通常关系数据库物理设计的内容包括:

  1. 为关系模式选择合适的存取方法
  2. 设计关系、索引等数据库文件的物理存储结构

三、子任务二:关系模式存取方法选择

为满足多用户共享数据的需求,需为关系建立多条存取路径,常见的存取方法有两种:

1. 索引存取方法

  • 核心是确定对关系的哪些属性列建立索引、组合索引或唯一索引。
  • 注意事项
    • 关系上的索引数量不宜过多,因为系统维护和查询索引都有性能开销。
    • 更新频率很高的表不适合建立索引,否则每次更新都需修改索引,会大幅增加维护成本。

2. 聚簇存取方法

  • 核心是将某个属性(或属性组,称为聚簇码)上具有相同值的元组,集中存放在连续的物理块中。
  • 优势
    • 大幅提高按聚簇码进行查询的效率。
    • 不仅适用于单个关系,也适用于经常进行连接操作的多个关系(可按连接属性值聚集存储)。

四、子任务三:确定数据库的存储结构

这一步需综合权衡存取时间、存储空间利用率、维护代价三个相互矛盾的因素,选择折中方案。

1. 确定数据的存放位置

为提升系统性能,需将数据按特性分开存放:

  • 易变部分与稳定部分分离。
  • 经常存取部分与存取频率较低部分分离。

2. 确定系统配置

利用关系数据库管理系统提供的系统配置变量和存储分配参数,进行物理优化。

3. 评价物理结构

综合衡量时间效率、空间效率、维护代价及用户需求,从多个设计方案中选出最优解。