当前位置: 代码网 > it编程>数据库>Mysql > MySQL 数据类型核心指南之选型、实战与避坑

MySQL 数据类型核心指南之选型、实战与避坑

2026年03月17日 Mysql 我要评论
前言在 mysql 数据库设计中,数据类型的选择直接影响存储效率、查询性能和数据准确性。选对数据类型能避免存储空间浪费、数据溢出、精度丢失等问题,而选错则可能导致系统隐患(如用int存储手机号导致截断

前言

在 mysql 数据库设计中,数据类型的选择直接影响存储效率、查询性能和数据准确性。选对数据类型能避免存储空间浪费、数据溢出、精度丢失等问题,而选错则可能导致系统隐患(如用int存储手机号导致截断)。本文将全面拆解 mysql 核心数据类型,结合实战案例讲解选型技巧,帮你从 “能用” 升级到 “用好” 数据类型。

一. mysql 数据类型分类总览

mysql 的数据类型丰富,按功能可分为五大类,覆盖数值、字符串、日期、特殊类型等场景:

分类核心类型适用场景
数值类型bit、tinyint、int、bigint、float、decimal存储数字(年龄、金额、计数等)
字符串类型char、varchar、text、blob存储文本(姓名、地址、大文本、二进制数据)
日期时间类型date、datetime、timestamp存储时间(生日、创建时间、时间戳)
特殊字符串enum(枚举)、set(集合)固定选项(性别、爱好、状态等)
二进制类型blob存储图片、文件等二进制数据

二. 数值类型:精准匹配数字范围与精度

数值类型是最常用的类型,核心关注范围和精度,避免数据溢出或精度丢失。

2.1 整数类型(bit/tinyint/int/bigint)

整数类型按占用字节和范围分为 5 类,支持unsigned(无符号)修饰(默认有符号):

类型占用字节有符号范围无符号范围适用场景
bit(m)1-81-64 位(默认 1 位)同有符号存储 0/1(性别)、位掩码
tinyint1-128 ~ 1270 ~ 255年龄、状态值(0-255)
smallint2-32768 ~ 327670 ~ 65535小范围计数(如订单编号)
int4-2147483648 ~ 21474836470 ~ 4294967295普通计数(如用户 id)
bigint8-9e18 ~ 9e180 ~ 1.8e19大数值(如手机号、雪花 id)

关键实战要点

  • 避免无符号类型(unsigned):虽然无符号类型能扩大正数范围,但可能导致溢出时报错(如tinyint unsigned插入 - 1 直接报错),且与有符号类型计算时容易出现逻辑问题。建议直接用更大的整数类型(如用int替代tinyint unsigned)。
  • bit 类型的坑:bit 字段存储的是位数据,查询时会按 ascii 码显示(如bit(8)存储 10 显示为换行符,存储 65 显示为 ‘a’),仅适合存储 0/1 等简单标识:
create table tt5(gender bit(1));
insert into tt5 values(0); -- 成功
insert into tt5 values(1); -- 成功
insert into tt5 values(2); -- 越界报错(bit(1)仅支持0/1)

2.1.1 tinyint 类型测试

tinyint 占用 1 字节,有符号范围 - 128~127,无符号范围 0~255:

-- 1. 创建有符号tinyint表
create table test_tinyint1(age tinyint);
-- 2. 插入合法值
insert into test_tinyint1 values(127); -- 成功(最大值)
insert into test_tinyint1 values(-128); -- 成功(最小值)
-- 3. 插入越界值(报错)
insert into test_tinyint1 values(128); 
-- 报错:out of range value for column 'age' at row 1
-- 4. 创建无符号tinyint表
create table test_tinyint2(age tinyint unsigned);
-- 5. 插入无符号合法值
insert into test_tinyint2 values(255); -- 成功(无符号最大值)
-- 6. 插入负数(无符号越界报错)
insert into test_tinyint2 values(-1); 
-- 报错:out of range value for column 'age' at row 1

2.1.2 bit 类型测试

bit 存储位数据,默认 1 位(仅支持 0/1),位数 m 需≤64,查询时按 ascii 码显示(易踩坑),但是我自己实际测试也有可能会是16进制的,大家可以自己去试试:

-- 1. 创建bit(1)字段的表
create table test_bit(gender bit(1));
-- 2. 插入合法值(0/1)
insert into test_bit values(0); -- 成功
insert into test_bit values(1); -- 成功
-- 3. 插入越界值(报错)
insert into test_bit values(2); 
-- 报错:data truncation: data too long for column 'gender' at row 1
-- 4. 查询bit字段(关键:直接查询显示ascii字符,需转成数字)
select gender, bin(gender+0) from test_bit;

运行结果

+--------+---------------+
| gender | bin(gender+0) |
+--------+---------------+
|       | 0             | -- 0的ascii显示为空白,转数字后是0
|       | 1             | -- 1的ascii显示为,转数字后是1
+--------+---------------+

2.1.3 int/bigint 对比测试

-- 1. int存储手机号(越界测试)
create table test_int(phone int);
insert into test_int values(13800138000); 
-- 报错:out of range value for column 'phone' at row 1(int最大值2147483647 < 13800138000)
-- 2. bigint存储手机号(成功)
create table test_bigint(phone bigint);
insert into test_bigint values(13800138000); -- 成功
select * from test_bigint;
+-------------+
| phone       |
+-------------+
| 13800138000 |
+-------------+

2.2 小数类型(float/double/decimal)

小数类型用于存储带小数点的数值,核心区别在于精度
以下是您需要的表格,已整理为清晰格式:

类型占用字节精度特性适用场景
float4单精度,约 7 位有效数字非精确计算(如身高、体重)
double8双精度,约 15 位有效数字较高精度计算(如温度)
decimal可变高精度(自定义整数 + 小数位)精确计算(如金额、税率)

2.2.1 float/decimal 精度对比测试

-- 1. 创建小数测试表
create table test_decimal(
  salary_float float(10,8),
  salary_decimal decimal(10,8)
);
-- 2. 插入相同数值
insert into test_decimal values(23.12345612, 23.12345612);
-- 3. 查询结果(精度差异)
select * from test_decimal;

运行结果:

+---------------+----------------+
| salary_float  | salary_decimal |
+---------------+----------------+
| 23.12345695   | 23.12345612    |
+---------------+----------------+

  • 发现decimal的精度更准确,因此如果我们希望某个数据表示高精度,选择decimal
  • 关键结论:float 是近似存储,存在精度丢失;decimal 是精确存储,适合金额、税率等场景。
  • float表示的精度大约是7位,decimal整数最大位置m为65,支持小数最大位置d是30,如果d被省略,默认位0,如果m被省略,默认是10。建议如果希望小数的精度高,推荐使用decimal。

2.2.2 decimal 范围测试

create table test_decimal2(price decimal(5,2)); -- 总长度5,小数位2 → 范围-999.99~999.99
insert into test_decimal2 values(999.99); -- 成功
insert into test_decimal2 values(1000.00); -- 报错:out of range value for column 'price' at row 1

三. 字符串类型:char 与 varchar 的终极选型

字符串类型是最容易用错的类型,核心是区分char(固定长度)和varchar(可变长度),以及text(大文本)的适用场景。

3.1 核心字符串类型对比

以下是您需要的表格:

类型长度限制存储特性适用场景
char(l)l ≤ 255(字符)固定长度,不足补空格长度固定(身份证、手机号)
varchar(l)l ≤ 65535(字节)可变长度,存储实际长度 + 1-3 字节长度标识长度不固定(姓名、地址)
text最大 65535 字节大文本,不支持默认值 / 全文索引长文本(文章内容、备注)
blob最大 65535 字节二进制存储图片、文件等二进制数据

3.2 char 与 varchar 深度测试

-- 1. 创建char/varchar对比表(utf8编码,1字符=3字节)
create table test_char_varchar(
  c_char char(4),
  c_varchar varchar(4)
) charset=utf8;
-- 2. 插入不同长度数据
insert into test_char_varchar values('abcd', 'abcd'); -- 4字符
insert into test_char_varchar values('a', 'a'); -- 1字符
insert into test_char_varchar values('中国', '中国'); -- 2字符
-- 3. 查询数据(查看实际存储)
select 
  c_char, length(c_char), -- char长度:固定12字节(4×3)
  c_varchar, length(c_varchar) -- varchar长度:实际字符×3 + 1字节
from test_char_varchar;

运行结果

+--------+---------------+------------+------------------+
| c_char | length(c_char)| c_varchar  | length(c_varchar)|
+--------+---------------+------------+------------------+
| abcd   |            12 | abcd       |               13 |
| a      |            12 | a          |                4 |
| 中国   |             6 | 中国       |                7 |
+--------+---------------+------------+------------------+

关键结论

  • char (4) 无论存储多少字符,都占用 12 字节(4×3),不足补空格;
  • varchar (4) 存储 1 字符占用 4 字节(3+1),2 字符占用 7 字节(6+1),4 字符占用 13 字节(12+1),更节省空间。

如何选择定长或变长字符串?

  • 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5
  • 如果数据长度有变化,就使用变长(varchar), 比如:名字,地址,但是你要保证最长的能存的进去。
  • 定长的磁盘空间比较浪费,但是效率高。
  • 变长的磁盘空间比较节省,但是效率低。
  • 定长的意义是,直接开辟好对应的空间
  • 变长的意义是,在不超过自定义范围的情况下,用多少,开辟多少。

3.3 varchar 长度限制测试

-- utf8编码下,varchar最大字符数=65532/3≈21844(预留1-3字节存长度)
create table test_varchar_limit1(name varchar(21845)) charset=utf8; 
-- 报错:row size too large. the maximum row size for the used table type, not counting blobs, is 65535.
create table test_varchar_limit2(name varchar(21844)) charset=utf8; -- 成功

四. 日期时间类型:date/datetime/timestamp 选型

日期时间类型用于存储时间相关数据,核心是区分三者的存储范围、时区特性和自动更新机制:

类型占用字节时间范围时区特性自动更新适用场景
date31000-01-01 ~ 9999-12-31生日、日期记录
datetime81000-01-01 ~ 9999-12-31固定时间(如订单创建时间)
timestamp41970-01-01 ~ 2038-01-19受时区影响支持自动更新时间戳(如最后修改时间)

4.1 timestamp 自动更新测试

-- 1. 创建日期测试表
create table test_datetime(
  t1 date,
  t2 datetime,
  t3 timestamp
);
-- 2. 仅插入date/datetime,timestamp自动填充当前时间
insert into test_datetime(t1,t2) values('1997-07-01','2008-08-08 12:01:01');
-- 3. 查询初始结果
select * from test_datetime;

运行结果 1

+------------+---------------------+---------------------+
| t1         | t2                  | t3                  |
+------------+---------------------+---------------------+
| 1997-07-01 | 2008-08-08 12:01:01 | 2024-05-20 15:30:22 | -- t3自动填充当前时间
+------------+---------------------+---------------------+

-- 4. 更新数据,timestamp自动刷新
update test_datetime set t1='2000-01-01';
-- 5. 查询更新结果
select * from test_datetime;

运行结果 2

+------------+---------------------+---------------------+
| t1         | t2                  | t3                  |
+------------+---------------------+---------------------+
| 2000-01-01 | 2008-08-08 12:01:01 | 2024-05-20 15:35:48 | -- t3自动更新为修改时间
+------------+---------------------+---------------------+

五. 特殊字符串类型:enum 与 set(单选 / 多选场景)

enum(枚举)和set(集合)适用于固定选项的场景,避免手动校验输入合法性。

5.1 enum(单选枚举)测试

-- 1. 创建枚举表
create table test_enum(
  username varchar(30),
  gender enum('男','女')
);
-- 2. 插入合法值
insert into test_enum values('雷锋','男'); -- 成功
insert into test_enum values('小红',2); -- 成功(2对应第二个选项'女')
-- 3. 插入非法值(报错)
insert into test_enum values('tom','未知'); 
-- 报错:data truncated for column 'gender' at row 1
-- 4. 查询枚举值
select username, gender, gender+0 from test_enum; -- gender+0查看枚举对应的数字
  • 运行结果

+----------+--------+-----------+
| username | gender | gender+0  |
+----------+--------+-----------+
| 雷锋     | 男     |         1 |
| 小红     | 女     |         2 |
+----------+--------+-----------+

5.2 set(多选集合)测试

-- 1. 创建集合表
create table test_set(
  username varchar(30),
  hobby set('登山','游泳','篮球','武术')
);
-- 2. 插入多选值
insert into test_set values('雷锋','登山,武术'); -- 成功
insert into test_set values('小红','游泳'); -- 成功(单选)
-- 3. 插入非法值(自动忽略)
insert into test_set values('tom','登山,游戏'); -- '游戏'不是选项,仅插入'登山'
-- 4. 查询包含某选项的记录(find_in_set函数)
select * from test_set where find_in_set('登山', hobby);
  • 运行结果

+----------+-----------+
| username | hobby     |
+----------+-----------+
| 雷锋     | 登山,武术 |
| tom      | 登山      |
+----------+-----------+

  • set的这个也可以用数字来代表,不过是由比特位来算的,比如1代表登山,2代表游泳,3代表的是登山和游泳(0011)

六. 数据类型选型避坑指南和总结

  • 按 “最小必要” 原则选型:如年龄用tinyint(0-255 足够),不用int;金额用decimal(10,2),不用float
  • 避免用字符串存储数字:如手机号用bigintchar(11),不用varchar(11)char查询更快);身份证用char(18)(固定长度),不用varchar
  • bit 类型查询需转数字:直接查询 bit 字段显示 ascii 字符,需用gender+0cast(gender as unsigned)转为数字。
  • 慎用 text/blob:大文本类型会降低查询性能,若能拆分字段(如将文章摘要单独存储为varchar),尽量避免直接用text
  • 日期类型优先选 datetime:除非明确需要时区转换或自动更新,否则datetime的兼容性和范围更优,避免timestamp的 2038 限制。

总结: mysql 数据类型的选择核心是 “匹配场景 + 平衡性能与空间”,本文补充了 ppt 中所有核心测试案例,关键要点总结:

  • bit/tinyint 有严格范围限制,插入越界值会直接报错,查询 bit 需转数字;
  • float 存在精度丢失,金额等精确场景必须用 decimal;
  • char 适合固定长度字符串(如手机号),varchar 适合可变长度字符串(如姓名);
  • timestamp 支持自动更新,但有 2038 年限制,普通场景优先用 datetime;
  • enum/set 简化固定选项存储,set 查询需用 find_in_set 函数。

到此这篇关于mysql 数据类型核心指南之选型、实战与避坑的文章就介绍到这了,更多相关mysql数据类型选型内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2026  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com