数据库系统概论第七章数据库设计.pdf

■把概念结构设计阶段设计好的基本ER图转换

为与选用DBMS产品所支持的数据模型相符合

的逻辑结构

:逻辑结构设计的步骤

将概念结构转化为一般的关系、网状、层次模型

将转换来的关系、网状、层次模型向特定DBMS支持

下的数据模型转换

-对数据模型进行优化

逻辑结构设计(续)

逻辑结构设计时的3个步骤

7.4.1ER图向关系模型的转换

7.4.2数据模型的优化

7.4.3设计用户子模式

:转换内容

:转换原则

ER图向关系模型的转换(续)

:*E-R图向关系模型的转换要解决的问题

-如何将实体型和实体间的联系转换为关系模式

-如何确定这些关系模式的属性和码

将E-R图转换为关系模型:将实体、实体的属性和

实体之间的联系转换为关系模式。

ER图向关系模型的转换(续)

实体型间的联系有以下不同情况:

(1)一个1:1联系可以转换为一个独立的关系模式,也可

以与任意一端对应的关系模式合并。

■转换为一个独立的关系模式

,与某一端实体对应的关系模式合并

(2)一个1:n联系可以转换为一个独立的关系模式,

也可以与n端对应的关系模式合并。

/与n端对应的关系模式合并

(3)一个m:n联系转换为一个关系模式。

例,“选修”联系是一个m:n联系,可以将它转

换为如下关系模式,其中学号与课程号为关系的

组合码:

选修(堂号,课程号,成绩)

(4)三个或三个以上实体间的一个多元联系转换为一个关

系模式。

例,“讲授”联系是一个三元联系,可以将它转换为

如下关系模式,其中课程号、职工号和书号为关系的

讲授(课程号,职工号,书号)

(5)具有相同码的关系模式可合并

■目的:减少系统中的关系个数

■合并方法:将其中一个关系模式的全部属性加入到另一个

关系模式中,然后去掉其中的同义属性(可能同名也可能

不同名),并适当调整属性的次序

注意:

:从理论上讲,1:1联系可以与任意一端对应的关系模式合并

但在一些情况下,与不同的关系模式合并效率会大不一样。

因此究竟应该与哪端的关系模式合并需要依应用的具体情

况而定。

由于连接操作是最费时的操作,所以一般应以尽量减少连

接操作为目标。

例如,如果经常要查询某个班级的班主任姓名,则将管理

联系与教师关系合并更好些。

[例]把图7.30中虚线上部的E-R图转换为关系模型

■部门实体对应的关系模式

部门(部门号,部门名,经理的职工号,…)

A此关系模式已包含了联系“领导”所对应的关系

模式

A经理的职工号是关系的候选码

■职工实体对应的关系模式

职工(职工号、部门号,职工名,职务,…)

A该关系模式已包含了联系“属于;所

3八Anintroductionystem

模r式

[例]把图7.30中虚线上部的E-R图转换为关系模型(续)

■产品实体对应的关系模式

产品(产品号,产品名,产品组长的职工号,…)

■供应商实体对应的关系模式

供应商(供应商号,姓名,…)

■零件实体对应的关系模式

零件(零件号,零件名,…)

■联系“参加”所对应的关系模式

职工工作(职工号,产品号,工作天数,…)

■联系“供应”所对应的关系模式

供应(产品号,供应商号,零件号,供应量)

:得到初步数据模型后,还应该适当地修改、调整数据模型

的结构,以进一步提高数据库应用系统的性能,这就是数

据模型的优化

关系数据模型的优化通常以规范化理论为指导

数据模型的优化(续)

优化数据模型的方法

确定数据依赖

按需求分析阶段所得到的语义,分别写出每个关系模式

内部各属性之间的数据依赖以及不同关系模式属性之间

数据依赖

2.确定所属范式

■按照数据依赖的理论对关系模式逐一进行分析

■考查是否存在部分函数依赖、传递函数依赖、多值依

赖等。

■确定各关系模式分别属于第几范式。

3.按照需求分析阶段得到的各种应用对数据处理的要求,

分析对于这样的应用环境这些模式是否合适,

确定是否要对它们进行合并或分解。

注意:并不是规范化程度越高的关系就越优,一般说

来,第三范式就足够了

例:在关系模式

学生成绩单(学号,英语,数学,语文,平均成绩)

中存在下列函数依赖:

学号一英语

学号一数学

学号一语文

学号一平均成绩

(英语,数学,语文)一平均成绩

显然有:

学号一(英语,数学,语文)

因此该关系模式中存在传递函数信赖,是2NF关系

虽然平均成绩可以由其他属性推算出来,但如果应

用中需要经常查询学生的平均成绩,为提高效率,

仍然可保留该冗余数据,对关系模式不再做进一步

分解

7A1ER图向关系模型的转换

:定义用户外模式时应该注重的问题

包括三个方面:

(1)使用更符合用户习惯的别名

(2)针对不同级别的用户定义不同的View,以

满足系统对安全性的要求。

(3)简化用户对系统的使用

设计用户子模式(续)

[例]关系模式产品(产品号,产品名,规格,单价,生产车

间,生产负责人,产品成本,产品合格率,质量等级),

口]以在广品关系上建立两个视图:

为一般顾客建立视图:

产品1(产品号,产品名,规格,单价)

为产品销售部门建立视图:

产品2(产品号,产品名,规格,单价,车间,生产

负责人)

顾客视图中只包含允许顾客查询的属性

■销售部门视图中只包含允许销售部门查询的属性

■生产领导部门则可以查询全部产品数据

可以防止用户非法访问不允许他们查询的数据,保证

系统的安全性

逻辑结构设计小结

任务

■将概念结构转化为具体的数据模型

■将概念结构转化为一般的关系、网状、层次模型

■将转化来的关系、网状、层次模型向特定DBMS支持

■对数据模型进行优化

■设计用户子模式

:*ER图向关系模型的转换内容

:+E-R图向关系模型的转换原则

1.确定数据依赖

2.对于各个关系模式之间的数据依赖进行极小化处理,

消除冗余的联系。

3.确定各关系模式分别属于第几范式。

4.分析对于应用环境这些模式是否合适,确定是否要对

它们进行合并或分解。

5.对关系模式进行必要的分解或合并

:设计用户子模式

1.使用更符合用户习惯的别名

2.针对不同级别的用户定义不同的外模式,以满足系统

对安全性的要求。

3,简化用户对系统的使用

:数据库的物理设计

■数据库在物理设备上的存储结构与存取方法称为数据

库的物理结构,它依赖于选定的数据库管理系统

■为一个给定的逻辑数据模型选取一个最适合应用环境

的物理结构的过程,就是数据库的物理设计

数据库的物理设计(续)

:数据库物理设计的步骤

■确定数据库的物理结构,在关系数据库中主要指存取方法

和存储结构

如果评价结果满足原设计要求,则可进入到物理实施阶段,

否则,就需要重新设计或修改物理结构,有时甚至要返回

逻辑设计阶段修改数据模型

7.5.1数据库物理设计的内容和方法

7.5.2关系模式存取方法选择

7.5.3确定数据库的存储结构

7.5.4评价物理结构

:设计物理数据库结构的准备工作

■对要运行的事务进行详细分析,获得选择物理数据库

设计所需参数

■充分了解所用RDBMS的内部特征,特别是系统提供的

存取方法和存储结构

数据库的物理设计的内容和方法(续)

选择物理数据库设计所需参数

■数据库查询事务

A查询的关系

>查询条件所涉及的属性

>连接条件所涉及的属性

>查询的投影属性

选择物理数据库设计所需参数(续)

■数据更新事务

A被更新的关系

A每个关系上的更新操作条件所涉及的属性

>修改操作要改变的属性值

每个事务在各关系上运行的频率和性能要求

关系数据库物理设计的内容

■为关系模式选择存取方法(建立存取路径)

■设计关系、索引等数据库文件的物理存储结构

:数据库系统是多用户共享的系统,对同一个关系要建立多

条存取路径才能满足多用户的多种应用要求

:物理设计的任务之一就是要确定选择哪些存取方法,即建

立哪些存取路径

关系模式存取方法选择(续)

:.DBMS常用存取方法

■索引方法

A目前主要是B+树索引方法

A经典存取方法,使用最普遍

聚簇(Cluster)方法

■HASH方法

、索引存取方法的选择

:根据应用要求确定

对哪些属性列建立索引

对哪些属性列建立组合索引

对哪些索引要设计为唯一索引

索引存取方法的选择(续)

选择索引存取方法的一般规则

如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立

索弓1(或组合索引)

如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上

建立索引

■如果一个(或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)

属性上建立索引

关系上定义的索引数过多会带来较多的额外开销

■维护索引的开销

■查找索引的开销

二、聚簇存取方法的选择

:聚簇

为了提高某个属性(或属性组)的查询速度,把这个或这些

属性(称为聚簇码)上具有相同值的元组集中存放在连续的

物理块称为聚簇

聚簇存取方法的选择(续)

:聚簇的用途

-1.大大提高按聚簇码进行查询的效率

例:假设学生关系按所在系建有索引,现在要查询信息系的

所有学生名单。

A信息系的500名学生分布在500个不同的物理块上时,至

少要执行500次I/O操作

A如果将同一系的学生元组集中存放,则每读一个物理块

可得到多个满足查询条件的元组,从而显著地减少了访

问磁盘的次数

2.节省存储空间

A聚簇以后,聚簇码相同的元组集中在一起了,因而聚

簇码值不必在每个元组中重复存储,只要在一组中存

一次就行了

:聚簇的局限性

■1.聚簇只能提高某些特定应用的性能

■2.建立与维护聚簇的开销相当大

A对已有关系建立聚簇,将导致关系中元组移动其物理存

储位置,并使此关系上原有的索引无效,必须重建

A当一个元组的聚簇码改变时,该元组的存储位置也要做

相应移动

:聚簇的适用范围

■1.既适用于单个关系独立聚簇,也适用于多个关系组

合聚簇

例:假设用户经常要按系别查询学生成绩单,这一查询涉

及学生关系和选修关系的连接操作,即需要按学号连接这

两个关系,为提高连接操作的效率,可以把具有相同学号

值的学生元组和选修元组在物理上聚簇在一起。这就相当

于把多个关系按“预连接”的形式存放,从而大大提高连

接操作的效率。

2.当通过聚簇码进行访问或连接是该关系的主要应用,

与聚簇码无关的其他访问很少或者是次要的时,可以

使用聚簇。

A尤其当SQL语句中包含有与聚簇码有关的ORDERBY,

GROUPBY,UNION,DISTINCT等子句或短语时,使

用聚簇特别有利,可以省去对结果集的排序操作

设计候选聚簇

>对经常在一起进行连接操作的关系可以建立聚簇

>如果一个关系的一组属性经常出现在相等比较条件中,则该

单个关系可建立聚簇

>如果一个关系的一个(或一组)属性上的值重复率很高,则此

单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不

太少。太少了,聚簇的效果不明显

:优化聚簇设计

>从聚簇中删除经常进行全表扫描的关系;

>从聚簇中删除更新操作远多于连接操作的关系;

A不同的聚簇中可能包含相同的关系,一个关系可以在某

一个聚簇中,但不能同时加入多个聚簇

-从这多个聚簇方案(包括不建立聚簇)中选择一个较优的,即

在这个聚簇上运行各种事务的总代价最小

三、HASH存取方法的选择

选择HASH存取方法的规则

■当一个关系满足下列两个条件时,可以选择HASH存取

方法

该关系的属性主要出现在等值连接条件中或主要出现

在相等比较选择条件中

A该关系的大小可预知,而且不变;

该关系的大小动态改变,但所选用的DBMS提供了动

态HASH存取方法

确定数据库物理结构的内容

■1.确定数据的存放位置和存储结构

A关系

>索引

>聚簇

>日志

>备份

■2.确定系统配置

1.确定数据的存放位置

:确定数据存放位置和存储结构的因素

二存储空间利用率

■维护代价

这三个方面常常是相互矛盾的

例:消除一切冗余数据虽能够节约存储空间和减少维

护代价,但往往会导致检索代价的增加

必须进行权衡,选择一个折中方案

确定数据的存放位置(续)

:基本原则

■根据应用情况将

易变部分与稳定部分分开存放

A存取频率较高部分与存取频率较低部分,分开存放

例:

A数据库数据备份、日志文件备份等由于只在故障恢复

时才使用,而且数据量很大,可以考虑存放在磁带上

A如果计算机有多个磁盘或磁盘阵列,可以考虑将表

和索引分别放在不同的磁盘上,在查询时,由于磁盘

驱动器并行工作,可以提高物理I/O读写的效率

例(续):

A可以将比较大的表分别放在两个磁盘上,以加快存取

速度,这在多用户环境下特别有效

A可以将日志文件与数据库对象(表、索引等)放在不

同的磁盘以改进系统的性能

2.确定系统配置

DBMS产品一般都提供了一些存储分配参数

■同时使用数据库的用户数

■同时打开的数据库对象数

内存分配参数

使用的缓冲区长度、个数

■存储分配参数

754评价物理结构

:评价内容

■对数据库物理设计过程中产生的多种方案进行细致的

评价,从中选择一个较优的方案作为数据库的物理结

评价物理结构(续)

:评价方法(完全依赖于所选用的DBMS)

■定量估算各种方案

>存储空间

>维护代价

■对估算结果进行权衡、比较,选择出一个较优的合理的

物理结构

如果该结构不符合用户需求,则需要修改设计

7.6数据库实施和维护

7.6.1数据的载入和应用程序的调试

7.6.2数据库的试运行

7.6.3数据库的运行和维护

数据的载入

应用程序的编码和调试

:数据库结构建立好后,就可以向数据库中装载数据了。组

织数据入库是数据库实施阶段最主要的工作。

数据装载方法

■人工方法

■计算机辅助数据入库

:数据库应用程序的设计应该与数据设计并行进

在组织数据入库的同时还要调试应用程序

在原有系统的数据有一小部分已输入数据库后,就可以开始对

数据库系统进行联合调试,称为数据库的试运行

数据库试运行主要工作包括:

1)功能测试

'实际运行数据库应用程序,执行对数据库的各种操作,测试应用

程序的功能是否满足设计要求

■如果不满足,对应用程序部分则要修改、调整,直到达到设计要

2)性能测试

■测量系统的性能指标,分析是否达到设计目标

■如果测试的结果与设计目标不符,则要返回物理设计阶段,重新

调整物理结构,修改系统参数,某些情况下甚至要返回逻辑设计

THE END
1.数据库物理设计原则Jackychen83数据库物理设计原则 1.1数据库环境配置原则 1.1.1操作系统环境: 对于中小型数据库系统,采用linux操作系统比较合适,对于数据库冗余要求负载均衡能力要求较高的系统,可以采用Oracle9iRAC的集群数据库的方法,集群节点数范围在2—64个。对于大型数据库系统,可以采用SunSolarisSPARC64位小型机系统或HP9000系列小型机系统。RAD5...http://blog.chinaunix.net/uid-685175-id-154686.html
2.纯字三千一起看看数据库的物理设计数据库教程6:数据库的...数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的DBMS的实现。 关系数据库物理设计的内容: 为关系模式选择存取方法(建立存取路径)。 为关系、 索引、 日志、 备份等数据库文件选择物理存储结构。 (索引)存取方法 索引用于关系模式的数据库中数据的存取方法。换句话说,一种索引就代表了一...https://www.imooc.com/article/319973
3.一文带你了解数据库设计基础列举物理设计过程中常见的反范式化处理手段。 以及对四个阶段有基本认识。 数据库设计的难点 熟悉数据库的人缺乏业务以及行业相关的专业知识 熟悉业务逻辑,但对数据库设计流程了解甚少。 数据库初始化设计阶段对业务理解不够透彻,设计的数据库有一定缺陷。 https://developer.aliyun.com/article/852495
4.数据库设计那些事——第3章物理设计sgalcheung3-1 数据库物理设计要做什么 物理设计要做什么 选择合适的数据库管理系统。如Oracle、SQLServer、MySQL及PgSQL。 定义数据库、表及字段的命名规范。 根据所选的DBMS系统选择合适的字段类型。 反范式化设计。 3-2 选择哪种数据库 常见的DBMS系统 商业数据库:Oracle和SQLServer(更适合企业级项目) ...https://www.cnblogs.com/sgalcheung/p/13937819.html
5.数据库的物理设计指什么数据库的物理设计:数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。为一个给定的逻辑数据模型选取一个更适合应用环境的物理结构的过程,就是数据库的物理设计。 若您在自考学习过程中有任何疑问,欢迎进入论坛讨论! https://www.zikao365.com/ask/wa2014062611182221422056.shtml
6.数据库的物理设计对性能的影响(以SQLite为例)选择合适的数据类型也是数据库物理设计中需要考虑的重要因素。在 SQLite 中,不同的数据类型对存储空间的占用和数据操作的性能有不同影响。 例如,使用整型数据类型比文本类型数据在存储空间和查询速度上都更有优势。因此,在设计数据库表结构时,需要根据实际情况选择合适的数据类型,以优化数据库的性能。 https://www.jianshu.com/p/74f9e69523ef
7.数据库设计文档20240518151210.pdf数据库设计文档.pdf,标题数据库设计文档,主要介绍数据库设计的一般原则实体和对象命名规范数据字典及系统基础模块等内容在摘要部分,简要回顾了这些原则,并对实例进行了详细阐述,如使用安全评价标准表来保证安全性采用安全检查标准表来保障安全性和材料表用来管理原材料https://m.book118.com/html/2024/0518/7015035005006111.shtm
8.院校信息计算机安全概述;数据库安全性控制;视图机制;审计;数据加密;统计数据库安全 第五章数据库完整性 实体完整性;参照完整性;用户定义完整性;完整性约束命令子句 第六章关系数据理论 规范化;数据依赖的公理系统;模式的分解 第七章数据库设计 数据库设计概述;需求分析;概念结构设计;逻辑结构设计;数据库的物理设计;数据库的...https://yz.chsi.com.cn/wap/sch/detail?schId=367894&categoryId=442342&infoId=81515157
1.数据库设计之物理结构设计数据库物理结构设计数据库物理设计过程中需要对时间效、空间效率、维护代价和各种用户要求进行权衡,其结果可以产生多种方案。评价物理数据库的方法完全依赖于所选用的关系数据库管理系统,主要是从定量估算各种方案的存储空间、存取时间和维护代价入手,对估算结果进行权衡、比较,选择出一个较优的、合理的物理结构。https://blog.csdn.net/lxw983520/article/details/80890419
2.优化物理数据库设计MicrosoftLearn企业数据库系统的性能依赖于组成这些系统的数据库中物理设计结构的有效配置。这些物理设计结构包括索引、聚集索引、索引视图和分区,其目的在于提高数据库的性能和可管理性。SQL Server 提供了数据库引擎优化顾问,这是用于分析工作负荷(对要优化的数据库执行的一组 Transact-SQL 语句)对一个或多个数据库性能的影响的工具...https://technet.microsoft.com/zh-cn/library/ms191531.aspx
3.数据库物理结构设计怎么写51CTO博客已为您找到关于数据库物理结构设计怎么写的相关内容,包含IT学习相关文档代码介绍、相关教程视频课程,以及数据库物理结构设计怎么写问答内容。更多数据库物理结构设计怎么写相关解答可以来51CTO博客参与分享和学习,帮助广大IT技术人实现成长和进步。https://blog.51cto.com/topic/shujukuwulijiegoushejizenmexie.html
4.空间数据库设计的过程和步骤开源地理空间基金会中文分会开放...数据库物理设计阶段 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式。 数据库实施阶段 运用DBMS提供的数据语言(例如SQL)及其宿主语言(例如C),根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,...https://www.osgeo.cn/post/7461g
5.数据库的物理结构设计物理结构设计是利用已确定的逻辑数据结构以及DBMS提供的方法、技术、以较优的存储结构、数据存取路径、合理的数据存储位置以及存储分配,设计出一个高效的、可实现的物理数据库结构。由于数据库的物理结构依赖于给定的计算机软件及硬件环境,依赖于所选用的DBMS。因此,设计数据库的物理结构应充分考虑数据库的物理环境,例如...https://www.xazcit.com/8486.html
6.Greenplum实时数据仓库实践(2)——数据仓库设计基础关系 由行和列构成的二维结构,对应关系数据库中的表,如示例中的分公司表和员工表。注意,这种认识只是我们从逻辑上看待关系模型的方式,并不应用于表在磁盘上的物理结构。表的物理存储结构可以是堆文件、索引文件或哈希文件。堆文件是一个无序的数据集合,索引文件中表数据的物理存储顺序和逻辑顺序保持一致,哈希文也称...https://cloud.tencent.com/developer/article/1913084
7.颜值与实用性并存的数据库建模工具Chiner教程数据库其它大家看下面的这个图,是完成表结构建模之后,能够帮我们自动生成各种数据库的建表语句。 不仅如此,还可以生成JAVA和C#的与数据库表相关的实体类代码。对的,它不仅是一个数据建模工具,还是一个代码生成器。 2.3. 支持逻辑视图与物理视图设计 在数据库设计过程中,我们通常需要在初始阶段先通过一个ER图(逻辑视图)来表现...https://www.jb51.net/article/240105.htm