Вставка 4-байтовых символов Юникода в MySQL / MariaDB - PullRequest
1 голос
/ 07 апреля 2019

При попытке вставить ? (например, 4-байтовый символ Юникода) MySQL (5.7) и MariaDB (10.2 / 10.3 / 10.4) выдают одинаковую ошибку:

Incorrect string value: '\xF0\x9F\x92\xA9'

Утверждение:

mysql> insert into bob (test) values ('?');

Вот кодировка / сопоставление моей базы данных:

mysql> select @@collation_database;                                                                     +----------------------+
| @@collation_database |
+----------------------+
| utf8mb4_unicode_ci   |
+----------------------+
1 row in set (0.00 sec)

mysql> SELECT @@character_set_database;                                                                 +--------------------------+
| @@character_set_database |
+--------------------------+
| utf8mb4                  |
+--------------------------+
1 row in set (0.00 sec)

Набор символов сервера:

mysql> show global variables like '%character_set_server%'\G;                                           *************************** 1. row ***************************
Variable_name: character_set_server
        Value: utf8mb4

Таблица:

create table bob ( `test` TEXT NOT NULL );
mysql> SHOW FULL COLUMNS FROM bob;
+-------+------+--------------------+------+-----+---------+-------+---------------------------------+---------+
| Field | Type | Collation          | Null | Key | Default | Extra | Privileges                      | Comment |
+-------+------+--------------------+------+-----+---------+-------+---------------------------------+---------+
| test  | text | utf8mb4_unicode_ci | NO   |     | NULL    |       | select,insert,update,references |         |
+-------+------+--------------------+------+-----+---------+-------+---------------------------------+---------+
1 row in set (0.00 sec)

Кто-нибудь может указать мне правильное направление?

1 Ответ

2 голосов
/ 07 апреля 2019

Да, как вы прокомментировали, вам нужно использовать SET NAMES utf8mb4.

Ваш 4-байтовый символ должен пройти от вашего клиента через соединение с базой данных и в таблицу. Все они должны поддерживать utf8mb4. Если один из них не поддерживает utf8mb4, то 4-байтовые символы не смогут пройти.

SET NAMES utf8mb4 заставляет сеанс базы данных ожидать, что клиенты отправят строку с использованием этой кодировки. Значение по умолчанию для character_set_client в MySQL 5.7 - utf8, поэтому вам нужно установить его в utf8mb4.

В MySQL 8.0.1 и более поздних версиях по умолчанию character_set_client уже есть utf8mb4, поэтому вам не нужно его менять.

...