Mysql字符集utf8和utf8mb4详解_Mysql

背景

1、mysql在5.5.3版本之后增加了utf8mb4的编码，mb4就是most bytes 4的意思，专门用来兼容四字节的unicode；

2、utf8mb4是utf8的超集，除了将编码改为utf8mb4外不需要做其他转换。当然，为了节省空间，一般情况下使用utf8也就够了；

名词解释

字符集(character set/charset)：字符的二进制编码方式；
utf-8：是unicode的实现方式之一，其他实现方式还有utf-16，utf-32，它是一种变长的编码，一个符号使用1~4个字节表示；
utf8：mysql中实现了utf-8编码的unicode字符集，是utf8mb3的别称，utf8编码中一个符号使用1~3个字节表示；
utf8mb4：mysql中实现了

关系

1、都实现了utf-8编码中的的unicode字符集；
2、utf8仅支持基本多语言平面basic multilingual plane (bmp)；
3、utf8mb4支持bmp之外的补充字符，如一些生僻的汉字，emoji字符，以及任何新增的unicode字符。
4、utf8一个字符最多使用3个字节存储，utf8mb4一个字符最多使用4个字节存储；
5、对于bpm字符，utf8和utf8mb4都使用三个字节存储；对于非bmp字符，utf8mb4使用4个字节存储，utf8不能存储非bmp字符；
6、innodb中默认最大可对767个字节建立索引；使用utf8的列最多可对255个字符建立索引；使用utf8mb4的最多可对191个字符建立索引；

实践

为了验证上面的理论，创建如下两个表：它们的字符集分别为utf8和utf8mb4

create table `test_utf8` (
  `id` bigint(20) unsigned not null auto_increment comment '主键',
  `name` varchar(5) not null comment '名称',
  primary key (`id`)
) engine=innodb default charset=utf8 comment='测试utf8';

create table `test_utf8mb4` (
  `id` bigint(20) unsigned not null auto_increment comment '主键',
  `name` varchar(5) not null comment '名称',
  primary key (`id`)
) engine=innodb default charset=utf8mb4 comment='测试utf8mb4';

向两个表中分别插入如下数据：

insert into test_utf8(name) values ('我是一颗小'), ('我是reo'), ('12345'), ('ggvdc');
insert into test_utf8mb4(name) values ('我是一颗小'), ('我是reo'), ('12345'), ('ggvdc');
insert into test_utf8mb4(name) values ('?????');

查看在两种字符集下的存储长度：

该图验证了上面3、4、5点理论；

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持代码网。

Mysql之索引的数据结构详解

为什么要使用索引索引是存储引擎用于快速找到数据记录的一种数据结构，就好比一本教科书的目录部分，通过目录中找到对应文章的页码，便可快速定位到需要的文章。mysql中也是一样的道理，进…

2024年12月26日 • 数据库

Mysql之SQL执行流程全面解析

执行流程图解查询缓存server 如果在查询缓存中发现了这条 sql 语句，就会直接将结果返回给客户端；如果没有，就进入到解析器阶段。需要说明的是，因为查询缓存往往效率不高，所以…

2024年12月26日 • 数据库

Mysql数据库缓冲池详解(Buffer pool)

buffer pool的作用innodb 存储引擎是以页为单位来管理存储空间的，我们进行的增删改查操作其实本质上都是在访问页面（包括读页面、写页面、创建新页面等... [阅读全文]

MySQL和HBase的使用对比

mysql和hbase的对比mysql：关系型数据库，主要面向 oltp ，支持事务，支持二级索引，支持 sql ，支持主从、 group replicatio... [阅读全文]

MySQL提示表不存在的解决error:1146:Table doesn‘t exist的原因和解决方法

mysql提示表不存在的解决 error:1146:table doesn't exist可能的原因1. 表名或数据库名错误拼写错误：首先检查你查询... [阅读全文]

MySQL导致索引失效的原因及分析

mysql什么情况下会导致索引失效索引（index）是数据库中一种用于快速查找和访问表中数据的结构，它类似于书的目录，通过索引可以快速定位到目标数据，而无需遍历整个表，索引的存在可…

2024年12月26日 • 数据库


验证码：

验证码：

Mysql字符集utf8和utf8mb4详解

2024年12月24日 • Mysql •我要评论

背景

名词解释

关系

实践

总结

相关文章:

Mysql之索引的数据结构详解

Mysql之SQL执行流程全面解析

MySQL导致索引失效的原因及分析

发表评论