MySQL 排序规则Collation实例详解_Mysql

在 mysql 中，排序规则（collation）是控制字符比较方式的核心机制，直接影响查询结果的排序、匹配逻辑（如大小写区分）等。本文将从基础概念出发，详解排序规则的作用、与字符集的关系、查看与配置方法，并通过实际案例说明其对查询结果的影响，帮助开发者精准控制数据匹配行为。

一、排序规则的核心概念

排序规则（collation）是字符集（character set）的 "配套规则"，定义了字符之间的比较、排序逻辑。其核心作用体现在两个维度：

大小写区分：是否将'a'和'a'视为相同字符；
编码适配：针对特定字符集（如 utf-8）的语言特性（如 accents 字符）制定比较规则。

例如，utf-8 字符集的utf8mb4_0900_ai_ci排序规则中：

ai表示 "accent-insensitive"（忽略重音）；
ci表示 "case-insensitive"（忽略大小写）；
而utf8mb4_0900_as_cs中，as（accent-sensitive）和cs（case-sensitive）则表示区分重音和大小写。

二、字符集与排序规则的关联

字符集与排序规则是 "一对多" 的关系：一个字符集可以对应多个排序规则，但每个排序规则仅属于一个字符集。两者的默认关联规则如下：

若仅指定字符集，排序规则将使用该字符集的默认值（如utf8mb4默认排序规则为utf8mb4_0900_ai_ci）；
若仅指定排序规则，字符集将自动匹配该排序规则对应的字符集（如指定utf8mb4_general_ci，字符集即为utf8mb4）。

三、排序规则的查看与配置

1. 查看字符集与排序规则信息

查看所有字符集及其默认排序规则：

-- 方法1：show命令
show character set;
-- 方法2：查询系统表
select * from information_schema.character_sets;

查看指定字符集的所有排序规则：

-- 查看utf8mb4字符集的所有排序规则
show collation where charset = 'utf8mb4';

查看数据库的默认字符集与排序规则：

-- 方法1：使用系统变量
use test_db; -- 切换到目标数据库
select @@character_set_database, @@collation_database;
-- 方法2：查询系统表
select default_character_set_name, default_collation_name
from information_schema.schemata 
where schema_name = 'test_db'; -- 替换为数据库名

2. 不同对象的排序规则设置

mysql 中，排序规则可在服务器、数据库、表、列、字符串五个层级设置，下层默认继承上层配置（可单独覆盖）。

对象	字符集设置方式	排序规则设置方式	说明
服务器	`character_set_server` 系统变量	`collation_server` 系统变量	未指定时，数据库默认继承服务器配置
数据库	建库时 `character set` 子句	建库时 `collate` 子句	未指定时，表默认继承数据库配置
表	建表时 `character set` 子句	建表时 `collate` 子句	未指定时，列默认继承表配置
列	字段定义中 `character set` 子句	字段定义中 `collate` 子句	最细粒度控制，直接影响字段查询逻辑
字符串常量	`select _utf8mb4'abc'`	`select 'abc' collate utf8mb4_general_ci`	临时指定，覆盖连接级别的默认规则

四、排序规则对查询结果的影响

排序规则不影响数据存储（存入的'a'和'a'会原样保存），但直接决定查询时的匹配逻辑。以下通过测试案例验证：

测试环境

mysql 版本：8.0.28
测试表：test_db.a（字段i为char(1)类型）

案例 1：忽略大小写的排序规则（`utf8mb4_0900_ai_ci`）

-- 设置字段排序规则为忽略大小写
alter table test_db.a change i i char(1) collate utf8mb4_0900_ai_ci;
-- 插入数据
insert into test_db.a values ('a'), ('a');
-- 查询：条件为'i = 'a''
select * from test_db.a where i = 'a'; 
-- 结果：返回'a'和'a'（两者被视为相同）

案例 2：区分大小写的排序规则（`utf8mb4_0900_as_cs`）

-- 设置字段排序规则为区分大小写
alter table test_db.a change i i char(1) collate utf8mb4_0900_as_cs;
-- 插入数据（同上）
insert into test_db.a values ('a'), ('a');
-- 查询：条件为'i = 'a''
select * from test_db.a where i = 'a'; 
-- 结果：仅返回'a'（严格区分大小写）

结论

字段的排序规则直接决定查询时的字符匹配逻辑；
若需查询时区分大小写，需将字段排序规则设置为*_cs（case-sensitive）类型；
若需忽略大小写，使用*_ci（case-insensitive）类型。

五、实践建议

明确大小写需求：根据业务场景选择排序规则。例如，用户名通常需要区分大小写（用*_cs），而商品名称可能忽略大小写（用*_ci）。
统一配置层级：建议在数据库或表级别统一设置排序规则，避免列级别配置混乱（特殊字段单独覆盖）。

查询时临时覆盖：如需临时改变匹配逻辑，可在查询中指定排序规则：

-- 临时按区分大小写查询（即使字段默认不区分）
select * from test_db.a where i collate utf8mb4_0900_as_cs = 'a';

注意连接级影响：客户端连接的collation_connection变量会影响字符串常量的匹配逻辑，若需一致行为，建议在字段级别显式指定排序规则。

总结

mysql 排序规则是控制字符比较逻辑的关键机制，其核心作用体现在查询阶段的匹配与排序行为。通过理解字符集与排序规则的关联、掌握多层级配置方法，并结合业务场景选择合适的规则（如区分 / 忽略大小写），可确保查询结果符合预期，避免因字符匹配问题导致的业务异常。

到此这篇关于mysql 排序规则collation实例详解的文章就介绍到这了,更多相关mysql排序规则内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

MySQL 排序规则Collation实例详解

一、排序规则的核心概念

二、字符集与排序规则的关联

三、排序规则的查看与配置

1. 查看字符集与排序规则信息

2. 不同对象的排序规则设置

四、排序规则对查询结果的影响

测试环境

案例 1：忽略大小写的排序规则（`utf8mb4_0900_ai_ci`）

案例 2：区分大小写的排序规则（`utf8mb4_0900_as_cs`）

结论

五、实践建议

总结

推荐阅读

Mysql索引合并的实现示例

MySQL中隔离级别的4种小结

MySQL中的EXPLAIN用法及解读

Nginx端口telnet不通排查过程及解决

nginx安装和前端访问配置以及403 Forbidden解决方案

nginx一些常用user_agent的匹配规则详解

猜你喜欢

发表评论

MySQL 排序规则Collation实例详解

一、排序规则的核心概念

二、字符集与排序规则的关联

三、排序规则的查看与配置

1. 查看字符集与排序规则信息

2. 不同对象的排序规则设置

四、排序规则对查询结果的影响

测试环境

案例 1：忽略大小写的排序规则（utf8mb4_0900_ai_ci）

案例 2：区分大小写的排序规则（utf8mb4_0900_as_cs）

结论

五、实践建议

总结

推荐阅读

Mysql索引合并的实现示例

MySQL中隔离级别的4种小结

MySQL中的EXPLAIN用法及解读

Nginx端口telnet不通排查过程及解决

nginx安装和前端访问配置以及403 Forbidden解决方案

nginx一些常用user_agent的匹配规则详解

猜你喜欢

发表评论

案例 1：忽略大小写的排序规则（`utf8mb4_0900_ai_ci`）

案例 2：区分大小写的排序规则（`utf8mb4_0900_as_cs`）