数据科学每日总结--Day7--数据库
数据库
实体集
定义:实体集是指具有相同属性的一组实体。在数据库中,实体是现实世界中可以被唯一识别的对象或事物,实体集则是同类实体的集合。 种类:强实体集(具有主键,可以独立存在,比如学生、教师、课程等),弱实体集(没有足够的属性来唯一标识自身,必须依赖其他实体集(拥有实体集)来做唯一标识,比如订单明细,部门中的种类) 二元、三元、四元:代表着两个、三个、四个实体集之间的关系,比如学生与课程之间的选修关系(一个学生选修一门课程)、医生、病人、药品之间的“开药”关系(某医生给某病人开某种药)、项目、员工、角色、时间之间的“参与”关系(某员工以某角色在某时间参与某项目)
关系集
定义:关系集是指实体集之间的联系或关联。关系集描述了两个或多个实体集之间的逻辑关系。 种类:一对一,一对多,多对多,自关联关系(实体集自身之间的关系,比如员工管理员工),标识关系集(用于弱实体集与拥有实体集之间的关系,帮助弱实体集唯一标识自身) 组合形式:
- 弱实体集必须与标识关系集组合出现,才能唯一标识弱实体。 
- 多值属性实体集通常与关系集组合,用于表示一个实体的多个属性值。 
- 多对多关系常常通过引入关联实体集来实现。 
概念模式
定义:概念模式是对整个数据库的全局逻辑结构的抽象描述,独立于具体的数据库管理系统(DBMS)和物理存储方式。 特点:
- 主要关注数据的实体、属性、实体之间的关系等。 
- 通常用实体-关系模型(ER模型)来表示。 
- 面向业务需求和数据结构设计,不涉及具体实现细节。 举例:学生、课程、教师等实体及它们之间的选课、授课等关系 
逻辑模式
定义:逻辑模式是在特定数据库系统下,对数据结构的详细描述,通常以表、字段、主键、外键等形式出现。 特点:
- 依赖于所选的数据库类型(如关系型数据库)。 
- 关注数据的组织方式,如表结构、数据类型、约束等。 
- 是概念模式的具体化,便于实现和操作。 举例:学生表、课程表、选课表等,字段类型、主外键约束(前者标识每一条记录,后者实现表与表之间的联系,保证数据的参照完整性)等。 
物理模式
定义:物理模式描述数据在存储介质上的实际存储方式和访问路径。 特点:
- 关注数据的物理存储结构,如文件组织、索引、分区、存储路径等。 
- 与硬件、操作系统、数据库管理系统的实现密切相关。 
- 影响数据库的性能和存储效率。 举例:某表存储在磁盘的哪个分区、采用何种索引、数据文件的具体路径等。 
SQL
概念:SQL是一种用于管理和操作关系型数据库的标准语言。它可以用来查询、插入、更新、删除数据,以及定义和管理数据库结构。
DDL(数据定义):用于定义和管理数据库结构(如表、视图、索引、模式等) 常见命令:
- CREATE:创建数据库对象(如表、视图等)。 
- ALTER:修改数据库对象的结构。 
- DROP:删除数据库对象。 
- TRUNCATE:清空表中的所有数据,但不删除表结构。 
DML(数据操作):用于对数据库中的数据进行操作(如插入、查询、更新、删除) 常见命令:
- SELECT:查询数据。 
- INSERT:插入数据。 
- UPDATE:更新数据。 
- DELETE:删除数据。 
