数据库系统基础(1)
一。数据
数据是对客观的一种描述,它是由能被计算机识别与处理的数值、字符等符号构成的集合,即数据是指描述事物的符号记录。数字,字母等文字,图形、图像、声音、视频,等等都是数据。
二。数据模型
数据模型描述数据的一级概念和定义。包含两个方面:
(1)数据的静态特征:基本结构,联系和约束。
(2)数据的动态特征:数据的操作。
数据模型的多级描述。
1。概念模型(Conceptual Data Model):是按用户的观点对数据和信息建模。
概念模型及其表示方法
概念模型是现实世界的抽象反映,不依赖于具体的计算机系统,是现实世界到机器世界的一个中间层次。
信息实体的概念
实体(ENTITY)客观存在并可以相互区分的事物叫实体。从具体的人、物、事件到抽象的状态与概念都可以用实体抽象地表示;实体不仅可以指事物本身,也可以指事物之间的具体联系。
属性(ATTRIBUTE)是实体所具有的某些特性,能过属性对实体进行描述。实体是由属性组成的。一个实体本身具有多种属性,能够唯一标识实体的属性称为该实体的码(键)。
键(KEY)一个实体有多个属性,这些属性之间是有关系的,它们构成该实体的属性集合。如果其中有一个属性或者多个属性构成的子集合能够唯一标识整个属性集合,则称该属性子集为为属性集合的键或者码。要注意,实体的属性集合可能有多个键,每一个键都称为候选键。但是一个属性集只能制定其中一个候选键作为唯一标识。当确定一个候选键做为唯一标识时,就称为属性集的主键或主码。外键描述了两个实体间的联系。
实体型(ENTITY TYPE)具有相同属性的实体必然具有共同的特征和性质。有实体名及其属性名来抽象和刻画同类实体,称为实体型。
实体集(ENTITY SET)同型实体的集合称为实体集。
联系(RELATIONSHIP)现实世界的事物之间是有联系的。
实体之间的联系:一对一的联系(1:1);一对多的联系(1:M);多对多联系(M:N)。
常用的概念模型有:ER模型,EER模型。
2。逻辑数据模型(Logical Data Model)
它决定了数据库系统的结构、数据定义语言和数据操纵语言、数据库设计方法、数据库管理系统软件的设计与实现。
数据模型及其三要素:数据结构、数据操作和数据的完整性约束三部分组成。
层次、网状、关系模型。最常用的是关系模型。
用二维表格结构表示实体以及实体之间的联系的数据模型称为关系模型。关系模型在用户看来是一个二维表格,其概念单一。
(1)关系(RELATION)一个关系就是一张二维表,每个关系都是一个关系名。
(2)元组(TUPLE)二维表中的行称为元组,每一行是一个元组。元组对应存储文件中的一条记录。
(3)属性和属性值 二维表的列称为属性(字段)
(4)域(DOMAIN)属性的取值范围称为域。
(5)关系模式,用关系名和包含的属性名的集合表示。例如:学生表的关系描述:学生(系编号,学号,姓名,性别,年龄)。
(6)键(KEY)或码 在关系的诸属性中,能够用来唯一标识元组的属性或属性组合称为关键字或码。在一个关系中,它的值不能为空。
(7)候选键 在一个关系中,存在多个属性(或属性组合)都能用来唯一标识该关系中的元组,那么它们都称为该关系的候选键或者候选码。
(8)主键 在一个关系的候选键中,被指定作为唯一标识的候选键称为该关系的主键
(9)主表和从表 是指通过外键相关联的两个表。以外键作为主键的表称为主表,外键所在的表称为从表。
(10)非主属性或非码属性
在一个关系中,不是组成码的属性称为该关系的非主属性或非码属性。
(11)公共关键字
它就是连接两个表的公共属性。
(12)关系的完整性规则
a. 域完整性 由用户根据实际情况对数据库中的数据的内容进行的规定称为域完整性规则,也称为用户定义完整性规则。通过这些规则限制数据库只接受符合完整性约束条件的数据值,从而保证数据库的数据合理可靠。例如,表中的性别数据只能是男和女,不能是其它值。
b. 实体完整性 要求在任何关系的任何一个元组中,主键的值不能为空值。它的现实意义是,关系模型对应的是现实世界的数据实体,而主键是实体唯一的表现,没有主键就没有实体。这是实体存在的最基本前提,所以叫实体完整性。
c. 参照完整性 又称为引用完整性,这条规则是对关系外部关键字规定,要求外部关键字取值必须是客观存在的,不允许在一个关系中引用另一个关系里不存在的元组。
未完待续————————