MySQL字符集

一、字符集和校验规则

字符集是一套符合和编码,校验规则(collation)是在字符集内用于比较字符的一套规则,即字符集的排序规则。MySQL可以使用对种字符集和检验规则来组织字符。

MySQL服务器可以支持多种字符集,在同一台服务器,同一个数据库,甚至同一个表的不同字段都可以指定使用不同的字符集,相比oracle等其他数据库管理系统,在同一个数据库只能使用相同的字符集,MySQL明显存在更大的灵活性。

每种字符集都可能有多种校对规则,并且都有一个默认的校对规则,并且每个校对规则只是针对某个字符集,和其他的字符集么有关系。

在MySQL中,字符集的概念和编码方案被看做是同义词,一个字符集是一个转换表和一个编码方案的组合。

Unicode(Universal Code)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode存在不同的编码方案,包括Utf-8,Utf-16和Utf-32。Utf表示Unicode Transformation Format。

二、查看mysql字符集方法

1、查看mysql服务器支持的字符集

mysql> show character set;
mysql> select *  from information_schema.character_sets;
mysql> select character_set_name, default_collate_name, description, maxlen  from information_schema.character_sets;

2、查看字符集的校对规则

mysql> show collation;
mysql> show collation like 'utf8';
mysql> select * from information_schema.collations where collation_name like 'utf8%';

3、查看当前数据库的字符集

mysql> show variables like 'character%';
+--------------------------+----------------------------------+
| Variable_name            | Value               |
+--------------------------+----------------------------------+
| character_set_client     | utf8               |
| character_set_connection | utf8               |
| character_set_database   | latin1              |
| character_set_filesystem | utf8               |
| character_set_results    | utf8               |
| character_set_server     | utf8               |
| character_set_system     | utf8               |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.00 sec)

名词解释:

  • character_set_client:客户端请求数据的字符集

  • character_set_connection:客户机/服务器连接的字符集

  • character_set_database:默认数据库的字符集,无论默认数据库如何改变,都是这个字符集;如果没有默认数据库,那就使用 character_set_server指定的字符集,这个变量建议由系统自己管理,不要人为定义。

  • character_set_filesystem:把os上文件名转化成此字符集,即把 character_set_client转换character_set_filesystem, 默认binary是不做任何转换的

  • character_set_results:结果集,返回给客户端的字符集

  • character_set_server:数据库服务器的默认字符集

  • character_set_system:系统字符集,这个值总是utf8,不需要设置。这个字符集用于数据库对象(如表和列)的名字,也用于存储在目录表中的函数的名字。

4、查看当前数据库的校对规则

mysql> show variables like 'collation%';
+----------------------+-------------------+
| Variable_name        | Value             |
+----------------------+-------------------+
| collation_connection | utf8_general_ci   |
| collation_database   | latin1_swedish_ci |
| collation_server     | utf8_general_ci   |
+----------------------+-------------------+
3 rows in set (0.01 sec)

名词解释:

  • collation_connection 当前连接的字符集。

  • collation_database 当前日期的默认校对。每次用USE语句来“跳转”到另一个数据库的时候,这个变量的值就会改变。如果没有当前数据库,这个变量的值就是collation_server变量的值。

  • collation_server 服务器的默认校对。

### MySQL 字符集设置及常见问题 MySQL字符集(Character Set)和排序规则(Collation)是数据库管理中的重要部分,直接影响数据存储、传输以及查询结果的准确性。以下是关于 MySQL 字符集设置及其常见问题的详细说明。 #### 1. 字符集与排序规则的基本概念 字符集定义了数据库如何存储字符数据,而排序规则则定义了字符数据在比较时的行为方式。例如,在字符序 `utf8_general_ci` 下,大小写不敏感,字符 "a" 和 "A" 是等价的[^3]。 #### 2. 字符集支持的层次结构 MySQL字符集支持可以细化到四个层次:服务器(server)、数据库(database)、数据表(table)和连接(connection)。每一层都可以独立设置字符集,但若未显式指定,则会继承上一层的默认值[^2]。 #### 3. 默认字符集的来源 如果在创建数据库或数据表时未明确指定字符集MySQL 将使用默认配置。默认字符集的优先级顺序如下: - 连接级别(Connection Level) - 数据库级别(Database Level) - 服务器级别(Server Level) 可以通过以下命令查看当前的字符集配置: ```sql SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` #### 4. 关键字符集变量 MySQL 中有多个与字符集相关的变量,其中最重要的是以下几个: - **character_set_client**:客户端发送的数据使用的字符集。 - **character_set_connection**:连接中用于转换字符集的中间字符集。 - **character_set_results**:查询结果返回给客户端时使用的字符集。 这些变量共同决定了数据在客户端与服务器之间的传输过程中的编码转换[^1]。 #### 5. 设置字符集的方法 可以通过多种方式设置 MySQL字符集: - **全局设置**:修改 MySQL 配置文件(如 `my.cnf` 或 `my.ini`),添加或修改以下内容: ```ini [mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_general_ci ``` - **会话设置**:通过 SQL 命令临时更改会话级别的字符集: ```sql SET NAMES utf8mb4; ``` - **C API 设置**:在使用 MySQL C API 时,可以通过 `mysql_options` 函数设置连接字符集,避免显式调用 `SET NAMES`[^4]。 #### 6. 常见问题及解决方案 以下是与 MySQL 字符集相关的常见问题及其解决方法: - **乱码问题**:通常是因为字符集不匹配导致的。确保从客户端到服务器再到存储的所有环节都使用相同的字符集。例如,将所有字符集统一为 `utf8mb4`。 - **插入失败问题**:如果插入的数据包含超出目标字符集范围的字符(如 `latin1` 不支持的字符),会导致插入失败或数据被替换为问号(`?`)。确保目标列的字符集支持所有可能的字符[^5]。 - **排序问题**:不同的排序规则会影响查询结果的排序顺序。选择合适的排序规则以满足业务需求。 #### 7. 示例代码 以下是一个完整的示例,展示如何设置 MySQL字符集并验证其效果: ```sql -- 修改数据库字符集 ALTER DATABASE my_database CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; -- 修改表字符集 ALTER TABLE my_table CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; -- 查看当前字符集配置 SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

GawynKing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值