关系数据库 - 数据库

# 2.1 关系数据库结构及形式化定义

# 2.1.1 关系

单一的数据结构 -- 关系

现实世界的实体以及实体之间的关系均用关系来表示

逻辑结构 --- 二维表

从用户角度，关系模型中数据的逻辑结构是一张二维表

# 域

域是一组具有相同数据类型的值的集合

整数、实数、自然数
某一个范围的数
指定长度的字符串集合

# 笛卡尔积

笛卡尔积
给定一组域 D1，D2，…，Dn，这些域中可以有相同的。 D1，D2，…，Dn 的笛卡尔积为： D1×D2×…×Dn ＝｛（d1，d2，…，dn）｜diDi，i＝1，2，…，n
1. 所有域的所有取值的一个组合
2. 不能重复
元组
笛卡尔积中每一个元素（d1，d2，…，dn）叫作一个 n 元组（n-tuple）或简称元组 (Tuple)
分量
笛卡尔积元素（d1，d2，…，dn）中的每一个值 di 叫作一个分量
基数
若 Di（i＝1，2，…，n）为有限集，其基数 (域中所包含的值的个数) 为 mi（i＝1，2，…，n），则 D1×D2×…×Dn 的基数 M 为：
笛卡尔积的表示方法
- 笛卡尔积可以表示为一个二维表
- 表中的每行对应一个元组，表中的每列对应一个域

# 关系

关系
D1×D2×…×Dn 的子集叫作在域 D1，D2，…，Dn 上的关系，表示为：
R（D1，D2，…，Dn）
- 关系名
- 关系的目或者度
单元关系于二元关系
- 当 n=1 时，称该关系为单元关系或者一元关系
关系的表示
关系也是一个二维表，表的每行对应一个元组，表的每列对应一个域
属性
- 关系中不同列可以对应相同的域
- 为了加以区分，必须对每列起一个名字，称为属性（Attribute）名
- n 目关系必有 n 个属性
码
- 候选码（Candidate key）：若关系中的某一属性组的值能唯一地标识一个元组，则称该属性组为候选码
- 全码（All-key）：关系模式的所有属性是这个关系模式的候选码，称为全码
- 主码（Primary key）：若一个关系有多个候选码，则选定其中一个为主码
- 外部码：不是当前关系的码，但是其它关系的主码
- 主属性：包含在任何候选码中的属性称为主属性。
- 非主属性：不包含在任何侯选码中的属性称为非主属性（ Non-Prime attribute）或非码属性（Non-key attribute）
三类关系
- 基本关系（基本表或者基表）
  实际存在的表，是实际存储数据的逻辑表示
- 查询表
  查询结果对应的表
- 视图表
  由基本表或者其他识图表导出的表，是虚表，不对应实际的数据
基本关系的性质
- 列是同质的
- 不同的列可以出自一个域
  其中每个列称为一个属性
  不同的属性要给与不同的属性名
- 列的顺序无所谓，列的次序可以任意交换
- 任意两个元组的候选码不能相同
- 行的顺序无所谓，行的次序可以任意交换
- 分量必须取原子值（最基本的）

# 2.2.2、关系模式

# 什么是关系模型

关系模式（型）

对关系的描述
静态的稳定的

关系（值）

关系模式在某一个时刻的状态或者内容
动态的，随时间变化的

关系是元组的集合，因此关系模式必须指出这个元组集合的结构，即它由哪些组成，这些属性来自哪些域，以及属性与域之间的映像关系。

# 定义关系模型

关系模式可以形式化的表示为：

R（U，D，DOM，F）

R 关系名
U 组成该关系的属性名集合
D 属性组 U 中属性所来自的域
DOM 属性向域的映象集合
F 属性间的数据依赖关系集合

关系定义模式通常可以简记为

R(U)

关系模式何关系往往统称为关系

# 关系模型的存储结构

关系模型的逻辑结构 - 表
关系模型的物理结构
1. 有的关系数据库管理中一个表对应一个操作系统文件，将物理数据组织交给操作系统完成；
2. 有的关系数据库系统从操作系统那里申请若干个大的文件，自己划分文件空间，组织表，索引等存储结构，并进行存储管理。

# 2.2.3 关系数据库

在一个给定的应用领域中，所有关系的集合构成一个关系数据库

关系数据库也有型和值之分

# 2.2 关系操作

# 2.2.1、基本关系操作

常用的关系操作
- 查询：选择、投影、连接、除、并、交、差、笛卡尔积
- 数据更新：插入、删除、修改
- 选择、投影、并、差、笛卡尔积是 5 种基本操作
关系操作的特点
- 集合操作方式：操作的对象和结果都是集合，一次一集合的方式

# 2.2.2、关系数据库语言的分类

关系代数语言
- 用对关系的运算来表达查询要求
- 代表 ISBL
关系演算语言：用谓词来表达查询要求
- 元组关系演算语言
  谓词变元的基本对象是元组变量
  代表：APLHA, QUEL
- 域关系演算语言
  谓词变元的基本对象是域变量
  代表：QBE
介于关系代数何关系演算之间的语言
- 代表 SQL

每一个 ISBL 语句都近似于关系代数表达式
关系代数、关系演算语言均是抽象的查询语言，这些抽象的语言与具体的关系数据库管理系统中实现的实际语言并不完全一样。但它们能用作评估实际系统中查询语言能力的标准或基础。

# 2.3 关系的完整性

# 2.3.1 关系的三类完整性约束

实体完整性和参照完整性
关系模型必须满足的完整性约束条件，称为关系的两个不变性，应该由关系系统自动支持
用户定义完整性
应用领域需要遵循的约束条件，体现了具体领域中的语义约束

# 2.3.2 实体完整性

(1) 实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。

(2) 现实世界中的实体是可区分的，即它们具有某种唯一性标识。

(3) 关系模型中以主码作为唯一性标识。

(4) 主码中的属性即主属性不能取空值。

# 2.3.3 参照完整性

关系间的引用
在关系模型中实体及实体间的联系都是用关系来描述的，因此可能存在着关系与关系间的引用。
外码
外码：设 F 是基本关系 R 的一个或一组属性，但不是关系 R 的码。如果 F 与基本关系 S 的主码 Ks 相对应，则称 F 是基本关系 R 的外码。
```
基本关系R称为参照关系
基本关系S称为被参照关系或目标关系
```
参照完整性规则
若属性（或属性组）F 是基本关系 R 的外码，它与基本关系 S 的主码 Ks 相对应（基本关系 R 和 S 不一定是不同的关系），则对于 R 中每个元组在 F 上的值必须为：
或者取空值（F 的每个属性值均为空值）
或者等于 S 中某个元组的主码值

# 2.3.4 用户定义的完整性

针对某一具体关系数据库的约束条件，反映某一具体应用所涉及的数据必须满足的语义要求
关系模型应提供定义和检验这类完整性的机制，以便用统一的系统的方法处理它们，而不要由应用程序承担这一功能

# 2.4 关系代数

关系代数

一种抽象的查询语言
用对关系的运算来表达查询

关系代数的三个要素

运算对象：关系
运算结果：关系
运算符：4 类

集合运算符（）
<img src="https://note-1311335427.cos.ap-shanghai.myqcloud.com/images/image-20220923174757666.png" alt="image-20220923174757666" style="zoom: 50%;" />

将关系看成元组的集合
运算是从关系的 “水平” 方向即行的角度来进行

专门的关系运算符
< img src="https://note-1311335427.cos.ap-shanghai.myqcloud.com/images/image-20220923175007786.png" alt="image-20220923175007786" style="zoom:50%;" />

不仅涉及行而且涉及列

关系代数运算的分类

传统的集合运算
并、差、交、广义笛卡尔积
专门的关系运算
选择、投影、连接、除

数据库