当前位置: 首页 > news >正文

【MySQL基础篇】:MySQL常用数据类型的选择逻辑与正确使用

✨感谢您阅读本篇文章,文章内容是个人学习笔记的整理,如果哪里有误的话还请您指正噢✨
✨ 个人主页:余辉zmh–CSDN博客
✨ 文章所属专栏:MySQL篇–CSDN博客

在这里插入图片描述

文章目录

  • 数据类型
    • 1.数据类型分类
    • 2.数值类型
      • int整形类型
      • bit位类型
      • float小数类型
    • 3.字符串类型
    • 4日期和时间类型
    • 5.enum和set
      • enum类型
      • set类型

数据类型

1.数据类型分类

分类数据类型说明
数值类型BIT(M)位类型。M指定位数,默认值1,范围1-64
TINYINT [UNSIGNED]带符号的范围-128~127,无符号范围0~255,默认有符号
BOOL使用0和1表示真和假
SMALLINT [UNSIGNED]带符号范围-2^15~2^15-1,无符号范围0~2^16-1
INT [UNSIGNED]带符号范围-2<^31~2^31-1,无符号范围0~2^32-1
BIGINT [UNSIGNED]带符号范围-2^63~2^63-1,无符号范围0~2^64-1
FLOAT[(M,D)] [UNSIGNED]M指定显示长度,D指定小数位数,占用4字节
DOUBLE[(M,D)] [UNSIGNED]表示比float精度更大的小数,占用空间8字节
DECIMAL(M,D) [UNSIGNED]定点数M指定长度,D表示小数点的位数
文本、二进制类型CHAR(size)固定长度字符串,最大255
VARCHAR(size)可变长度字符串,最大长度65535
BLOB二进制数据
TEXT大文本,不支持全文索引,不支持默认值
时间日期DATE/DATETIME/TIMESTAMP日期类型(yyyy-mm-dd),(yyyy-mm-dd hh:mm:ss),timestamp时间戳
String类型ENUM类型字符串对象,值来自表创建时在列规定中显示枚举的一个列值
SET类型字符串对象,可包含零或多个允许值,多个值用逗号分隔(值中不能包含逗号)

接下来会讲解几个常用类型的使用:

2.数值类型

int整形类型

1.TINYINT

TINYINT          -- 有符号:-128 到 127
TINYINT UNSIGNED -- 无符号:0 到 255
  • 存储空间大小:1字节;
  • 常见用途:布尔值,状态标志,年龄等小数值;
  • 示例
 create table users(id int,age tinyint,status tinyint
);

不管是有符号还是无符号的,插入的数值必须在要求范围中才能插入成功,否则就会插入失败

在这里插入图片描述

后面的几个整型类型也是如此,就不演示了。

2.SMALLINT

SMALLINT          -- 有符号:-32,768 到 32,767
SMALLINT UNSIGNED -- 无符号:0 到 65,535
  • 存储空间大小:2字节;
  • 常见用途:年份,端口号,小计数值等;

3.INT

INT               -- 有符号:-2,147,483,648 到 2,147,483,647
INT UNSIGNED      -- 无符号:0 到 4,294,967,295
  • 存储空间大小:4字节;
  • 常见用途:主键,用户ID,计数器等;

4.BIGINT

BIGINT            -- 有符号:-9,223,372,036,854,775,808 到 9,223,372,036,854,775,807
BIGINT UNSIGNED   -- 无符号:0 到 18,446,744,073,709,551,615
  • 存储空间大小:8字节;
  • 常见用途:大数值,时间戳,大数据场景等;

注意

  • 尽量不要使用unsigned无符号,对于int类型存不下的数据,换成int unsigned同样可能存不下,那还不如直接设置成一个更大的int类型;
  • 较小的整形索引更快,选择合适的类型可以节省空间,而且整形比字符串要更加高效;

bit位类型

1.语法格式

BIT(M) -- M表示位数, 范围1-64

2.基本用法

  • 单比特存储
create table flags(id int,is_active bit(1),    -- 存储0/1is_deleted bit(1)    -- 存储0/1
);
  • 多比特存储
create table permissions(id int,user_flag bit(8),   -- 8位用户权限system_flag bit(32) -- 32位系统标志
);

3.存储范围

BIT(1)   -- 0 或 1
BIT(8)   -- 0 到 255
BIT(16)  -- 0 到 65535
BIT(32)  -- 0 到 4294967295
BIT(64)  -- 0 到 18446744073709551615

4.插入数据

-- 方式1:使用十进制
insert into permissions values(1001, 21, 252);-- 方式2:使用b前缀(b表示二进制字面量) 比较推荐这种写法
insert into permissions values(1002, b'10101', b'11111100');-- 方式3:使用十六进制
insert into permissions values(1003, 0x15, 0xFC);

5.查询和显示

-- 默认显示
select *from permissions;

在较新版本的MySQL8.0中,BIT类型默认以十六进制格式显示(在老版本中会显示看不见任何数据):

在这里插入图片描述

除了默认格式显示,也可以指定形式显示:

 select id,bin(user_flag) as user_flag_binary,  -- 二进制格式显示hex(system_flag) as system_flag_hex  -- 十六进制格式显示from permissions;

在这里插入图片描述

float小数类型

float是单精度浮点数类型,用于存储小数数据;

1.基本语法

float[(M,D)] [unsigned] [zerofill]
  • M:总位数(精度);
  • D:小数点后的位数(标度);
  • unsigned:无符号(非负数);
  • zerofill:用零填充;

存储范围和精度:

-- FLOAT的存储特性
-- 范围:-3.402823466E+38 到 -1.175494351E-38, 0, 1.175494351E-38 到 3.402823466E+38
-- 精度:约7位十进制数字

2.常用示例

  • 创建表时使用float
create table products(name varchar(30),price float(8,2),weight float(8,3),rating float,discount float(3,2) unsigned
);
  • 插入数据:
insert into products values('苹果', 5.99, 0.250, 4.5, 0.10),('香蕉', 4.88, 0.200, 4.0, 0.15),('橙子', 3.99, 0.300, 3.9, 0.20);
  • 查询和计算:
-- 基本查询
select * from products;-- 数学计算select name,price,price*(1-discount) as final_price -- 计算折扣后的价格from products;

在这里插入图片描述

3.精度问题

以float(4,2)为例,表示的范围就是-99.99-99.99MySQL在保存数据时会进行四舍五入;如果是float(8.2),表示的范围就是-99999999.99-99999999.99,同样也是四舍五入;

insert into products values('葡萄', 2.991, 0.150, 4.1, 0.15),('桃子', 2.947, 0.350, 3.7, 0.20);

在这里插入图片描述

如果是一个float(4,2) unsigned 无符号的,这时表示范围就是0-99.99,直接把负数舍弃掉;

除了float之外,还有一个浮点数类型decimal,它的用法和float一模一样,float怎么用,decimal就怎么用(这里就不展示示例了),唯一的区别就是表示的精度不同

create table test(id int,f1 float(10,8),f2 decimal(10,8)
);

在这里插入图片描述

对于插入相同的一个浮点数,floatdecimal因为精度不同,导致存储的数据不同;

  • float的精度大约为7位;
  • decimal整数最大位数m为65位,如果m省略,默认位10;支持小数最大位数d是30,如果d被省略,默认为0;
  • 如果希望小数的精度高,推荐使用decimal

3.字符串类型

CHAR 类型

  • 固定长度:无论存储多少字符,都占用相同的存储空间;

  • 语法:char(M) 其中 M 是字符数(1-255),char(2)表示可以存放两个字符,可以是字母或汉字,但是不能超过2个;

  • 存储方式:总是占用 M 个字符的存储空间,不足的部分用空格填充;

VARCHAR 类型

  • 可变长度:根据实际存储的字符数占用存储空间;

  • 语法:varchar(M) 其中 M 是最大字符数(不能超过65535字节);

  • 存储方式:只占用实际字符数 + 1-3字节的长度前缀(用来记录数据大小);

示例

create table student(name varchar(30),gender char(2)
);insert into student values('张三', '男'),('李四', '女');select * from student;
+--------+--------+
| name   | gender |
+--------+--------+
| 张三   ||
| 李四   ||
+--------+--------+

注意点

varchar(M)中,M的大小和表的编码密切相关;

在编码utf8中,一个字符占用3个字节,假设长度前缀占用一个字符,就是三个字节,所以实际上有效字节数就是65535-3=65532;有效字符数就是65532/3=21844;

所以在创建表时,使用varchar定义的字符大小一定不能超过21844,这是单个varchar列的限制

create table s1(name varchar(21844),  -- 21844 * 3 = 65532字节
)charset utf8;

在这里插入图片描述

但是还要考虑整行大小限制,一行除了varchar大小之外,还有其他字段的大小,比如下面这种情况:

create table s1(name varchar(21844),  -- 21844 * 3 = 65532字节gender char(2)        -- 2 * 3 = 6字节
)charset utf8;

实际计算:

  • name 列:21844字符 × 3字节 = 65532字节

  • gender 列:2字符 × 3字节 = 6字节

  • VARCHAR长度前缀:3字节(存储实际长度)

  • 总计:65532 + 6 + 3 = 65541字节 > 65535字节

正确的最大长度应该是:

-- 计算:65535 - 其他列开销 - VARCHAR长度前缀
-- 65535 - 6 - 3 = 65526字节
-- 65526 ÷ 3 = 21842字符

在这里插入图片描述

char和varchar比较

实际存储char(4)varchar(4)char占用字节varchar占用字节
abcdabcdabcd4*3=124*3+1=13
AAA4*3=121*3+1=4
Abcde数据超过长度数据超过长度

如何选择定长或变长字符串?

  • 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5

  • 如果数据长度有变化,就使用变长(varchar), 比如:名字,地址,但是你要保证最长的能存的进去。

  • 定长的磁盘空间比较浪费,但是效率高。

  • 变长的磁盘空间比较节省,但是效率低。

  • 定长的意义是,直接开辟好对应的空间

  • 变长的意义是,在不超过自定义范围的情况下,用多少,开辟多少。

4日期和时间类型

常用的日期有以下三个

  • date:日期yyyy-mm-dd,占用三个字节;
  • datetime:时间日期格式yyy-mm-dd hh:ii:ss表示范围从1000到9999,占用八个字节;
  • timestap:时间戳,从1970年开始的yyyy-mm-dd hh-ii-ss格式和datetime完全一致,占用四个字节;

示例

create table birthday(-> t1 date,-> t2 datetime,-> t3 timestamp default current_timestamp-> );

default current_timestamp在插入数据时不用输入,时间戳会自动补上当前时间;通常用来更新数据的插入时间;

在这里插入图片描述

5.enum和set

enum类型

1.基本语法

enum('值1', '值2', '值3', ...);

2.存储机制-数字存储

  • 内部存储:用整数存储(1, 2, 3…),可以理解为从1开始的下标;

  • 值1 = 1,值2 = 2,值3 = 3…以此类推;

  • 存储空间:1-2字节(取决于选项数量);

3.常用示例

-- 创建表
create table student (name varchar(50),gender enum('男', '女'),status enum('active', 'inactive', 'pending')
);-- 插入数据
insert into users values 
('张三', '男', '1'),
('李四', '女', '2'),
('赵六', '1', '3');-- 查询(可以用数字代替字符串)
select * from student where gender = 1;  -- 等同于 where gender = '男'
select * from student where status = 2;  -- 等同于 where status = 'inactive'

在这里插入图片描述

4.数字存储验证

select gender,gender + 0 as gender_number,status,status + 0 as status_numberfrom student;

在这里插入图片描述

set类型

1.基本语法

set('值1', '值2', '值3', ...)

2.存储机制-位掩码存储

  • 内部存储:用位掩码(bitmask)存储;

  • 值1 = 1 (001),值2 = 2 (010),值3 = 4 (100);

  • 组合存储:多个值用位运算组合;

  • 存储空间:1-8字节(取决于选项数量);

3.位掩码示例

-- 假设 set('A', 'B', 'C', 'D');
-- A = 1(0001)
-- B = 2(0010)
-- C = 4(0100)
-- D = 8(1000)-- 组合存储
-- 'A, B' = 1 + 2 = 3(0011)
-- 'A, C' = 1 + 4 = 5(0101)
-- 'B, C, D' = 2 + 4 + 8 = 14(1110)

4.常用示例

-- 创建测试表create table student(name varchar(30),gender char(2),hobby set('篮球', '足球', '羽毛球', '乒乓球'));-- 插入数据
insert into student values('张三', '男', '篮球'),('李四', '女', '羽毛球, 乒乓球'),('王五', '男', '2'),('赵六', '女', '7');-- 查询
select * from student;
select * from student where hobby = 1;       -- 1对应0001,篮球
select * from student where hobby = '羽毛球'; -- 查找羽毛球的

在这里插入图片描述

这里就有一个问题了,在查找羽毛球时,显示为空,但是表中明明有人包含了羽毛球,为什么会没有显示出来呢?

这是因为set类型的精确匹配特性

  • where hobby = ‘羽毛球’ 是精确匹配;

  • 它只查找 hobby 字段完全等于 ‘羽毛球’ 的记录;

  • 而在上面的数据中,羽毛球都是和其他爱好组合在一起的;

但是我们实际生活中每个人都有好几个爱好,总不能必须只有一个爱好才能查找出来吧?当然不是,这时候就要借助其他查找方式了

这里推荐两种方式:

  • 使用find_in_set函数
select * from student where find_in_set('羽毛球', hobby);
  • 使用位运算
-- SET('篮球', '足球', '羽毛球', '乒乓球') 的位掩码
-- 篮球=1, 足球=2, 羽毛球=4, 乒乓球=8
select * from student where hobby & 4;

在这里插入图片描述

5.位掩码存储验证

select name,hobby,hobby + 0 as hobby_numberfrom student;

在这里插入图片描述

总结

性能优势

enum优势

  • 存储效率高:1-2字节 vs VARCHAR的变长存储

  • 查询速度快:整数比较比字符串比较快

  • 索引效率高:整数索引更紧凑

set优势

  • 多选存储:一个字段存储多个值

  • 位运算查询:支持高效的位运算查询

  • 存储紧凑:多个选项组合存储

注意事项

enum注意事项

  • 数字转换:可以用数字代替字符串,但不推荐
  • 修改选项:修改ENUM选项会影响现有数据
  • 空值:NULL和空字符串是不同的

set注意事项

  • 顺序无关:‘A,B’ 和 ‘B,A’ 等价
  • 重复值:自动去重
  • 位运算:理解位掩码有助于高级查询
    位掩码存储验证**

以上就是关于MySQL数据类型中常用的几个类型的使用讲解,如果哪里有错的话,可以在评论区指正,也欢迎大家一起讨论学习,如果对你的学习有帮助的话,点点赞关注支持一下吧!!!

http://www.dtcms.com/a/302992.html

相关文章:

  • Go语言-->变量
  • 【Practical Business English Oral Scene Interpretation】在职日常交流No.1~6
  • MySQL面试题及详细答案 155道(001-020)
  • 重构企业交互逻辑:云蝠智能 Voice Agent 的落地价值与实践指南
  • 设计模式(二十一)行为型:状态模式详解
  • 常见的未授权访问漏洞靶场-练习教程
  • MCP架构:模型上下文协议的范式革命与工程实践
  • 安宝特新闻丨安宝特与Logivations正式建立合作伙伴关系,共筑物流新未来
  • OpenLayers 综合案例-区域掩膜
  • JavaWeb 新手学习路线:从零到全栈开发,系统掌握企业级 Web 开发技能
  • 【Java Web实战】从零到一打造企业级网上购书网站系统 | 完整开发实录(三)
  • 7.DRF 过滤、排序、分页
  • 微信小程序——早餐小程序
  • 22 BTLO 蓝队靶场 Countdown 解题记录
  • 博士申请 | 荷兰阿姆斯特丹大学 招收计算机视觉(CV)方向 全奖博士生
  • 代码的“防伪水印“:签名证书的隐形安全标记
  • 【python高阶】-1- python工程和线程并发
  • 电路防倒灌设计 --- 双pmos防倒灌
  • 学习dify:一个开源的 LLM 应用开发平台
  • AUTOSAR标准下CAN网络休眠异常诊断机制的创新研究
  • SD卡简介与驱动开发
  • Linux环境-设置Anaconda环境变量 Anaconda路径
  • 力扣1315. 祖父节点值为偶数的节点和
  • TDSQL 技术详解
  • Codeforces Round 1039 (Div. 2)(A-E1)
  • 【前端】React 与 Vue:前端两大框架的全方位对比解析
  • CMakelists.txt 实现多级目录编译
  • redis未授权getshell四种方式
  • 【ELasticsearch】搭建有负载均衡 ELB 的 ES 集群
  • TongESBv7报错:DatabaseConnectionException: no connection available(by lqw)